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В настоящем пособии на простых примерах 'раскрывают- 
ся такие разделы эконометрики, как парная и множествен- 
ная регрессии (метод наименьших квадратов (МНК) и его 


статистическо 


м рассмотрены 
предпосылки, оценка линейности связи, коэффициенты кор- 
реляции и детерминации, 


анализ статистической значимости тики, как в 

коэффициентов, доверительные интервалы и испытания ги- ние гипотез. 
потез в линейном регрессионном анализе, тест Чоу), гетеро- 
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ы ростая модель и с поправкой на тренд), системы 
дновременных уравнений 


ний (косвенный М н- 
тификации, двухшаговый МНК). Так о роблема иде 
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ким показателям. В настоящее время имеется ряд обстоя- 
тельных руководств по эконометрике. Но, по мнению авто- 
ра, всем им присущ один существенный недостаток — они 
не учитывают реальные учебные планы обучения студентов 
экономических специальностей вузов. Предлагаемое пособие 
знакомит читателя с рядом важнейших разделов экономет- 
рики и призвано помочь тем, кто осваивает этот курс, осо- 
бенно в системе заочного и вечернего образования. 

Традиционно предполагается, что студенты, изучающие 
эконометрику, уже прослушали курс теории вероятностей и 
математической статистики. На практике же большинство 
из них не обладает требуемым уровнем математической и 
статистической подготовки. Поэтому в первых двух главах 
рассмотрены такие важные разделы математической статис- 
тики, как построение доверительных интервалов и испыта- 
ние гипотез. и 

Третья и четвертая главы посвящены вопросам линейной 
регрессии (соответственно парной и множественной). В них 
представлен фундаментальный метод оценки параметров 
уравнений регрессии — метод наименьших квадратов. 

Пятая, шестая и седьмая главы затрагивают проблему не- 
выполнимости предпосылок метода наименьших квадратов 
(гетероскедастичность, автокорреляция, мультиколлинеар- 
ность). В них приводятся способы обнаружения и смягчения 
последствий. 

В восьмой главе изучаются модели, содержащие вместе с 
количественными переменными и качественные переменные 
(фиктивные переменные). В девятой главе рассмотрены не- 
линейные регрессионные модели. Тема десятой главы — по- 


рядковые испытания. 


В одиннадцатой и двенадцатой главах изучаются основ. 
ные понятия временных рядов, способы построения прогно. 
зов, метод скользящей средней и экспоненциальное сглажи. 
вание. 

В тринадцатой главе анализируются системы одновремен. 
ных уравнений, рассматриваются методы нахождения оце- 
нок для таких систем и исследуется проблема идентифика- 
ции. 

Весь материал пособия разбит на главы, а главы — на 
параграфы. Каждый параграф — это отдельная тема курса 
«Эконометрика». В начале параграфа приводится необходи. 
мый минимум теоретических сведений, затем подробно раз- 
бираются модельные примеры. После каждого разобранного 
примера приводится задача для самостоятельного решения. 
Ответы ко всем задачам помещены в конце книги. Пособие 
содержит также программу курса и задачи для контрольной 
работы. 

В книге показано, как можно избежать долгих и утоми- 
тельных вычислений с помощью пакета Ехсе] (надстройка 
«Пакет анализа» и встроенные статистические функции). 
Обычно книги по эконометрике содержат большое количест- 
во табулированных значений всевозможных распределений. 
Автор сознательно отказался от этого, заменив ссылками на 
соответствующие статистические функции пакета Ехсе]. 

За основу книги приняты курсы, читаемые автором в Рос- 
сийской академии предпринимательства. Всем студентам, 


прослушавшим эти курсы, автор выражает б агодарность за 
продуктивную совместную работу. 5 

Автор выражает искреннюю признательность В. М. Троя- 
новскому за многочисленные замечания, 
улучшению книги. 
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Глава 1 


ДОВЕРИТЕЛЬНЫЕ 
ИНТЕРВАЛЫ 


Изучаемая генеральная совокупность может быть очень 
большой. Поэтому с целью экономии времени и матери- 
альных ресурсов случайным образом производят выборку 
из генеральной совокупности. Для этой выборки вычисля- 
п 

Хм 
== ‚ выборочную диспер- 


ют выборочную среднюю Х = 
п 


т 


м 
=] 


сию 5° = и интересующие нас параметры. Как 


оценить параметры генеральной совокупности, зная эти па- 
раметры для выборки? 

Для генеральной совокупности строится доверительный 
интервал — интервал значений, в пределах которого, как 
мы можем надеяться, находится параметр генеральной со- 
вокупности. Наша надежда выражается доверительной ве- 
роятностью — вероятностью, с которой доверительный 
интервал «захватит» истинное значение параметра гене- 
ральной совокупности. Чем выше доверительная вероят- 
ность, тем шире доверительный интервал. Значение дове- 


рительной вероятности выбирает сам исследователь. Обыч- 
но это 0,9; 0,95; 0,99. 


8 1.1. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ 
ДЛЯ ГЕНЕРАЛЬНОЙ СРЕДНЕЙ а 
(генеральная дисперсия о’ известна) 


Если генеральная совокупность подчиняется нормальному 
закону распределения с известной дисперсией о”, то 


Х - 20/39/\п <а <Х + 2о2о/ п , 
где Х — выборочная средняя, п — объем выборки, а = 1 —р, 
р — доверительная вероятность, 2/2 берем из таблицы. 


Гол Гааз [02 
ыы 0,842 | 1,036 | 1,282 


Для вычисления 20/2 можно также воспользоваться ста. 
‚ тистической функцией НОРМСТОБР(1 — <) мастера функ. 
ций {#, пакета Ехсе]. 


Пример 1. Автомат, работающий со стандартным от. 
клонением о = 5 г, фасует чай в пачки. Проведена случай- 
ная выборка объемом п = 30 пачек. Средний вес пачки чая 
в выборке Х = 101 г. Найдем доверительный интервал для 
среднего веса пачки чая в генеральной совокупности с до- 
верительной вероятностью р = 95%. 


р= 0,95 => а=1-р=1- 0,95 =0,05 = а/2 = 0,025 > 
2а/2 = 1,96. 


Х20/з9/\п= 101 +1,96%5/\30 = 101 +1,79, то есть ис- 
комый интервал (99,21; 102,79). 


Задача 1. Автомат, работающий со стандартным от- 
клонением о = $3 г, фасует чай в пачки. Проведена случай- 
ная выборка объемом п = 40 пачек. Средний вес пачки чая 
в выборке Х = 79 г. Найти доверительный интервал для 


среднего веса пачки чая в генеральной совокупности с до- 
верительной вероятностью р = 99%. 


Замечание. Вместо вычислений по формуле 2о/20/ \ п 


можно было бы воспользоваться функцией ДОВЕРИТ(о; о; п) 
мастера функций Е, пакета Ехсе!. 


8 1.1.1. Объем выборки, необходимый для оценки 
генеральной средней 


Пример 2. Вернемся к примеру 1. Мы получили дове- 
рительный интервал Х + 2о/20/\[п = 101 41,79. Предноло- 
жим, что нам нужна ширина дове 


рительного инте 
ва. 
+1 грамм. Каким должен быть объем выборки? а 


20/20/51 = «> ао = п (9/29) = (1,96 5) — 
=96,04, то есть минимальный объем выборки равен 97 
Так как объем первоначальной выборки равен ак ы 
ем новой выборки равен 97 —30 = 67 пачек. Находим у р 
нюю Х для объединенной выборки в 97 пачек ел 
именно среднюю для выборки в 97 единиц, а не прь Е 
арифметическое средних для выборок объемов 30 и 67 2 
чек) и получаем доверительный интервал для средней в а. 
неральной совокупности Х +1. ` 


6 


Задача 2. Каким должен быть объем выборки в задаче 1, 
если требуемая ширина доверительного интервала + 0,5 г? 


$ 1.2. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ 
ДЛЯ ГЕНЕРАЛЬНОЙ СРЕДНЕЙ а 
(генеральная дисперсия о? неизвестна) 


Если генеральная совокупность подчиняется нормальному 
закону распределения с неизвестной дисперсией 0?, то 

а Фа/2п-18/ п-1<а<Х+ Фа/2.и-18/ р 5 

где Х — выборочная средняя, п — объем выборки, © = р 
р — доверительная вероятность, $ — выборочное стандарт- 
ное отклонение. Значение $/2„_1 берем из таблицы &-рас- 
пределения (распределения Стьюдента). Для вычисления 
значения #/2„-1 также можно воспользоваться статисти- 
ческой функцией СТЬЮДРАСПОБР (0; п- 1) мастера 
функций Ё, пакета Ехсе!. 

Пример 3. Автомат фасует чай в пачки. Проведена слу- 
чайная выборка объемом п = 30 пачек. Средний вес пачки 
чая в выборке Х = 101 г, выборочное стандартное откло- 
нение 3 = 4.г. Найдем доверительный интервал для средне- 
го веса пачки чая в генеральной совокупности с довери- 
тельной вероятностью р = 95%. 


р=0,95 = а= 1-р=1- 0,95 =0,05 => о/2 = 0,025. 

п 30 =п- 1=29 = рай г 10,025; 29# 2,045. 

Хи 18/1 = 101 +2,045 х4/\?29 = 101 +1,52, то 
есть искомый интервал (99,48; 102,52). 

Задача 3. Автомат фасует чай в пачки. Проведена слу- 
чайная выборка объемом п = 46 пачек. Средний вес пачки 
чая в выборке Х = 79 г, выборочное стандартное отклоне- 
ние $ = 3 г. Найти доверительный интервал для среднего 
веса пачки чая в генеральной совокупности с доверитель- 
ной вероятностью р = 99%. 


$ 1.2.1. Объем выборки, необходимый для оценки 
генеральной средней 


Пример 4. Вернемся к примеру 3. Мы получили дове- 
рительный интервал Х + Фа/2,п-18/ т —1=101+1,52. Пред- 
положим, что нам нужна ширина доверительного интерва- 
ла +1 г. Каким должен быть тогда объем выборки? 


ааа 151-118 2-1 (из 


2 из них к 
5 п>1 + (/з-18)й = 1 + (2,0454); = 67,9, то есть мини. рая да 
мальный объем выборки равен 68. Но плохо то, что #/›„, ности 7’ 


зависит от п. Тем не менее, полученный результат можно 

использовать. На самом деле п будет меньше. 1. 06 
Если полученное значение п > 30, то можно вместо 5 4.3.1: 

о/2"_1 рассмотреть 20/2 И о о 

20/28 /\п-1<1 => п>1+ (20/28)? = 1+ (1, = 62,47, то Ве 

есть минимальный объем выборки равен 63. Так как объем 

первоначальной выборки равен 30, то объем новой выборки 

равен 63—30=33 пачки. Находим среднюю Х для объеди- 

ненной выборки в 63 пачки и получаем доверительный ин- 

тервал для средней в генеральной совокупности Х +1. 


Задача 4. Каким должен быть объем выборки в задаче 3, 
если требуемая ширина доверительного интервала +0,5 г? 


$ 1.3. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ 
ДЛЯ ГЕНЕРАЛЬНОЙ ДОЛИ 


Очень часто нас интересует, 
доля объектов генеральной со. 
ределенным свойством. 
Производится выборка объема п. Для нее вычисляется 
выборочная доля р — доля объектов, обладающих этим свой- 
ством. Тогда при выполнении условий пр> Г п(1 -Р >5 


доверительный интервал для генеральной доли задается 
формулой Р+ 2/2 Р(1-Р)/п. 

Пример 5. Проведена выборка объема п = 
из них оказались бракованными. Найдем доверительный 
интервал доли бракованных изделий в генеральной сово- 
купности для доверительной вероятности р = 95% Ё 
В=150/2000 = 0,075. 
пр = 2000 0,075 = 150 > 5. 
п(1-р)=2000Х(1- 0,075) = 1850 > 5. 

Оба условия выполнены. 


какова генеральная доля — 
вокупности, обладающих оп- 


2000 шт. 150 


р=0,95 > «=1-р=1-0,95 = 0,05 > о/2- 0 

= 2/2 = 1,96. 045. 
Р+2о/2РА-Р/п = 0,075 + 1,96\/0,075А = 0,075)/2000 - 

=0,075 + 0,012. 


То есть искомый интервал (0,063; 0,087). 


Задача 5. Проведена выборка объема п = 1000 шт. 120 
из них оказались бракованными. Найти доверительный ин- 
тервал доли бракованных изделий в генеральной совокуп- 
ности для доверительной вероятности р = 99%. 


8 1.3.1. Объем выборки, необходимый для оценки 
генеральной доли 


Пример 6. Вернемся к примеру 5. Мы получили дове- 
рительный интервал р+ 20/5\|2(1-Р)/п=0,075+0,012. Пред- 
положим, что нам нужна ширина доверительного интерва- 
ла +0,005. Каким должен быть тогда объем выборки? 


2а/>\ Б(1 —5)/п < 0,005 > 

= (2о/2)’РА —Б)/п < 0,005? =0,000025 = 

> п> (2о/2)*Р(1 —5)/0,000025 = 

=1,962Ж0,075Ж(1-0,075)/0,000025 = 10660. 

То есть минимальный объем выборки равен 10660. Так 
как объем первоначальной выборки равен 2000, то объем 
новой выборки равен 10660 — 2000 = 8660 деталей. Нахо- 


дим выборочную долю бракованных изделий р для объеди- 
ненной выборки в 8660 деталей и получаем доверительный 
интервал для доли бракованных изделий в генеральной со- 
вокупности р + 0,005. 


Задача 6. Каким должен быть объем выборки в задаче 5, 
если требуемая ширина доверительного интервала + 0,003? 


Глава 2 


ИСПЫТАНИЕ ГИПОТЕЗ 


$ 2.1. ПРОЦЕДУРА ИСПЫТАНИЯ ГИПОТЕЗ 


Очень часто генеральная совокупность должна подчиняться 
некоторым параметрам. Например, фасовочная машина 
должна наполнять пакеты сахаром по 1 кг. Как Узнать, дей. 
ствительно ли генеральная совокупность подчиняется этим 


п. Для этой выборки вычисляют нужны 
Затем формулируют две гипотезы: 
нативную Н!. Основная гипотеза 
ние, которое подлежит проверке. 


е характеристики. 
основную Ну и альтер- 
Но — это то утвержде- 


испытания, Для одност й 
Я оронней про- 
верки а =1-—р, для двусторонней проверки а = (1—р)/2. 
Величина 1-р называется Уровнем 


ычисля 
ваемая статистикой ется вели 


чина ы 
й. Формула для выч › назы 


исления статисти- 
ачение статистики 
мости от взаимного 
И гра 

а варианте раничных точек 


Для правос' 


Для двустор. 


Отклоне! 
Принят: 


[а -р), 


граничн 


1) принимается Но; 
2) отклоняется Но и без всякой проверки принимается 
Нз; 

3) доказательство является неубедительным, нужно 
больше данных. 
Для левосторонней проверки: 


Отклонение Но 
Принятие Н\ 
(1-р)% 


Принятие Но 
р% 


граничная точка 


ТЬся Е 
тина Для правосторонней проверки: 
дей. Принятие Но | Отклонение Но 
тим р% Принятие Ну 
тез, (1 —р)% 
ьема граничная точка 
ики, Для двусторонней проверки: 
‘тер- 
виа Отклонение Но| Принятие Ну | Отклонение Но 
Принятие Н\ р% Принятие Н\! 
ты" [1 —2)/2]% [9 —2)/21% 
‚ $ граничная точка граничная точка 
ытТЬ 
Чем выше доверительная вероятность, тем шире область 
принятия Но. 
5 2.2. ИСПЫТАНИЕ ГИПОТЕЗ НА ОСНОВЕ 

рая ВЫБОРОЧНОЙ СРЕДНЕЙ ПРИ ИЗВЕСТНОЙ 
едо- ГЕНЕРАЛЬНОЙ ДИСПЕРСИИ с" 
тро- -85 
)/2 . Для выборки объема п вычисляется выборочная средняя и 

а — предполагаемое значение генеральной средней. Гра- 
таб- ничные точки: 2о (для правосторонней проверки), —га (для 
две левосторонней проверки), +2а (для двусторонней провер- 
рые ки). Значение го находим по таблице (см. $ 1.1). Статистика 
гра- ве ка : 

с/т 

ян . Пример 7. Автомат, работающий со стандартным от- 
ТЕ о  клонением о = 1 г, фасует чай в пачки со, средним весом 
ики а = 100 г. В случайной выборке объема п = 25 пачек сред- 
гого ний вес Х = 101,5 г. Надо ли отрегулировать автомат? До- 
чек. верительная вероятность р — 95%. 
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нормальной совокупности генеральная Редняя 
Но: для 


а=100 г. 


Ну: а* 100 г. проверку. 
5 0,025 = 2а= 1,96 = гранич, 
@= — — , 


те точки + 1,96. 
НЫ о _ 101,5-100 _ 7,5 


Статистика 2 = а. ЗА _ 


Отметим значения на числовой оси. 


Отклоняем гипотезу Но и принимаем гипотезу Н! на 
уровне значимости 5%. Автомат нужно отрегулировать. 


Задача 7. Автомат, работающий со стандартным от- 
клонением о = 1,5 г, фасует чай в пачки со средним весом 
а = 80 г. В случайной выборке объема п = 16 пачек сред- 


ний вес Х = 78,5 г. Надо ли отрегулировать автомат? Дове- 
рительная вероятность р = 99%. 


Пример 8. Станок, 
нением о = 0,5 мм, 
а = 20 мм. В случай 
средняя длина Х 
нок? Доверительн: 


работающий со стандартным откло- 
производит детали средней длины 
ной выборке объема п = 16 деталей 


= 19,8 мм. Правильно ли настроен ста- 
ая вероятность р = 99%. 


Н1: а < 20 мм. 
Проведем левостороннюю проверку. 
=1-р=1-0,99 = | хе 
ка 6. : я 2а= 2,326 = граничная точ- 


Статистика г = А-а _ 19,8 —20 


оп `0,5/ 16 = 196. 
Отметим значения на Числовой оси. 
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Принимаем гипотезу Но на уровне значимости 1%. Ста- 
нок настроен правильно. 


Задача 8. Станок, работающий со станд 


артным откло- 
нением с = 0,4 мм, 


производит детали средней длины 
а = 30 мм. В случайной выборке объема п = 


= 25 деталей 
средняя длина Х = 30,1 мм. Правильно ли настроен ста- 


нок? Доверительная вероятность р = 95%. 


$ 2.3. ИСПЫТАНИЕ ГИПОТЕЗ НА ОСНОВЕ 
ВЫБОРОЧНОЙ СРЕДНЕЙ ПРИ НЕИЗВЕСТНОЙ 
ГЕНЕРАЛЬНОЙ ДИСПЕРСИИ 


Для выборки объема п вычисляются выборочная средняя Х 
и выборочное стандартное отклонение з. Пусть а — пред- 
полагаемое значение генеральной средней. По таблице 
1-распределения находим #„,„_1. В Ехсе] для двусторонней 
проверки Ёо„„-1 = СТЬЮДРАСПОБР(1 —р; п- 1), для одно- 
сторонней проверки фи = СТЬЮДРАСПОБР(2(1 — р); 
п-П). Граничные точки: Фа,п-1 (для правосторонней про- 
верки), —,п_1 (для левосторонней проверки), Е, „_1 (для дву- 
Ба 

п-т 

Пример 9. Производитель утверждает, что средний вес 
пачки чая не меньше а = 100 г. Инспектор отобрал 10 па- 
чек чая и взвесил. Их вес оказался 97, 102, 103, 98, 96, 
105, 98, 100, 101 и 99 г соответственно. Не противоречит 
ли это утверждению производителя? Предполагается, что 
вес пачек чая распределен нормально. Доверительная веро- 
ятность р = 99%. 


сторонней проверки). Статистика # = 


- енеральная < 
Но: для нормальной совокупности генер ‘Редная С атистик 
а = 100 г. им 
Н:: а<100г. ороннюю проверку. ны 
а и: 0,01 = Фа.-1 = 10,010-1= 2,821 > ке ры 
а=Ё-р=Е-У, ы : й. 2е г 
граничная точка —2,821. Доверите. 
Найдем Х и 5. ол 
п Но: Д 
Ух 999 == 0,03. 
Е = 99,9 г. р ‚> 
Е ыы 


Ре = Е 12,9 7.99 г2. з=\17,29 = 2,7 г. 
5 _99,9 — 100_ =—0,111. ое 


: х- 
= я 
Статистика . ЕЕ 2,1/\10—1 Стат 


Отметим значения на числовой оси. 


Но 
99% 


—0,111 


Принимаем гипотезу Но на уровне значимости 1%. Вы- 


борка инспектора не противоречит утверждению произво- 
дителя. 


Задача 9. Производитель утверждает, что средний вес 
плитки шоколада не меньше а = 50 гр. Инспектор отобрал 
10 пачек чая и взвесил. Их вес оказался 49, 50, 51, 52, 48, 
47, 49, 52, 48 и 51 г соответственно, Не противоречит ли 
это утверждению производителя? Предполагается, 
плитки шоколада распределен но 
вероятность р = 95%. 


что вес 
рмально. Доверительная 


$ 2.4. ИСПЫТАНИЕ ГИПОТЕЗ НА ос 
ВЫБОРОЧНОЙ ДОЛИ а 


Для выборки объема п вычисляется 
р = (число элементов выборки, обладаю 
ством)/(объем выборки) и сравнивается с генеральной до- 
лей р. Граничные точки: 2 (для правосторонней провер- 
ки), —2а (для левосторонней проверки), +2. (для двусторон- 
ней проверки). Значение 2, находим по таблице (см. $ 1.1). 


выборочная доля 
щих нужным свой- 
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5-Р 
РА -Р)/® 


Статистика 2 = 


Пример 10. Производитель утверждает, что доля бра- 
кованных изделий не превосходит 3%. В случайной выбор- 
ке объема п = 100 изделий оказалось 5 бракованных изде- 
лий. Не противоречит ли это утверждению производителя? 
Доверительная вероятность р = 95%. 


Но: доля бракованных изделий равна 3%, то есть 
р = 0,03. 

Ну: р > 0,03. 

Проведем правостороннюю проверку. 

а=1-р=1- 0,95 =0,05 = 2 = 1,645. Это граничная 
точка. 

Оценка р = 5/100=0,05. 


Статистика 2 = р = ОВ =1,172. 


\Ра-рР)/” \о,0за —0,03)/100 


Отметим значения на числовой оси. 


Вы- 
зво- Принимаем гипотезу Но на уровне значимости 5%. Вы- 


борка не противоречит утверждению производителя. 


Задача 10. Производитель утверждает, что доля брз- 
кованных изделий не превосходит 7%. В случайной выбор- 
ке объема п = 150 изделий оказалось 16 бракованных из- 
делий. Не противоречит ли это утверждению производите- 
ля? Доверительная вероятность р — 99%. 


д 6 


$ 2.5. ИСПЫТАНИЕ ГИПОТЕЗ 
о ДВУХ ГЕНЕРАЛЬНЫХ ДИСПЕРСИЯХ 


Очень часто про две независимые выборки объема п1 и по 
соответственно нужно узнать, взяты ли они из нормаль- 
ных генеральных совокупностей с одинаковой дисперсией, 
Для каждой выборки находим выборочную дисперсию $1 
и $2’ соответственно. Оценка генеральной дисперсии по 
= п181?/(п1 — №). Оценка генеральной 


> 2 
первой выборке о! = н 
дисперсии по второй выборке о2* = п282 /(пз-— 1). Статисти- 


ля 
ой- 
до- 
эр- 
›н- 
Е 154 


та Ехсе|. 


ски инвестиций равны. 


ы генеральной дисперсии)/(меньца, 
н 


исперсии). - 

ё объем выборки, У которой больше 
означи 

альной дисперсии, через пв об М объем 

оценка генер Так как дисперсия неотрицательна, то 

другой г граничная точка РозпА-1тв-1ь Кото. 

ебуется 

нам потребу з таблицы Р-распределения (распределения 

ом спользоваться статистической функци. 
о ы 

Фишера). Мржво В 1) мастера функций И 

ей ЕРАСПОБР (0; пАд- 1; Пв 


ка Р = (ббльшая още 


оценка генеральной 
Обозначим через ПА 


Пример 11. Инвестиция 1 ИЯ ей 
дисперсия ежегодных прибылей 31 абы. 
2 рассчитана на по = 10 лет, дисперсия ежегод р 
лей $2? = (30%)?. Предполагается, что распределение еже- 
годных прибылей на инвестиции подчиняется ом 
закону распределения. Равны ли риски инвестиций 1 и 2? 
Доверительная вероятность р = 95%. 
Но: ©12 5: с>?. 
Ни: 912 сы о2?. 
Оценка генеральной дисперсии по первой выборке 
©1*=п131"/(п1 —1)=12Ж20/(12—1)=21,818. 
Оценка генеральной дисперсии по вто 
92° = П282?/(по = 1) = 10%30/(10—1)= 33,333. 
Статистика Е = (большая оценка генеральной диспер- 
сии)/(меньшая оценка генеральной дисперсии) = 
33,333/21,818 = 1,528. 
Так как 33,333 > 21,818, 
Проведем двустороннюю 


рой выборке 


то пд=10, пв=12. 
проверку. 


а=(1-р)/2=(1-—0,95)/2 = 0,025 > Е 
= Е0,025;10-1;12-1 = 2,896 = граничные точки 
я на числовой оси. 


точки + 2,896. 
Отметим значени 


Задача 11. Инвестиция 1 рассчитана на 
дисперсия ежегодных прибылей 81° = (15% }? 1 М лет, 
2 рассчитана на п) = 12 лет, `. 


дисперсия 

г РЕЯ 

лей 32° = (20%). Предполага: ое 
годных прибылей на инвести; 


ется, что расп 
ции подчиняе 


ке 


ке 


закону распределения. Равны ли риски инвестиций 1 и 2? 
Доверительная вероятность р = 99%. 


$ 2.5.1. Двухвыборочный Е-тест для дисперсии 


В Ехсе! существует надстройка Пакет анализа, которая 
позволяет автоматически провести испытание гипотезы о 
двух генеральных дисперсиях. Нужно воспользоваться ко- 
мандой Сервис. В раскрывшемся списке команд должна 
присутствовать команда Анализ данных. При ее отсутст- 
вии необходимо выбрать команду Надстройки и поставить 
«галочку» рядом с командой Пакет анализа. Если же 
команда Пакет анализа отсутствует, то нужно произвести 
доустановку Ехсе]. 

Сервис —> Анализ данных —> Двухвыборочный Е-тест 
для дисперсии -> ОК. Откроется диалоговое окно, которое 
нужно заполнить. В графе Интервал переменной 1: указы- 
вается ссылка на ячейки, содержащие значения первой вы- 
борки. В графе Интервал переменной 2: указывается ссыл- 
ка на ячейки, содержащие значения второй выборки. 

Если первая из ячеек содержит пояснительный текст, 
то рядом со словом Метки нужно поставить «галочку». В 
графе Альфа указывается уровень значимости 1-р (по 
умолчанию там уже указано 0,05, но исследователь может 
выбрать и свое значение). Также указываются параметры 
вывода (Выходной интервал, Новый рабочий лист, Новая 
рабочая книга) -> ОК. Откроется итоговое окно. 

Здесь проверка всегда односторонняя. Если в графе 
Р(Е<=|) одностороннее указана величина, меньшая вы- 
бранного Альфа, то мы отклоняем гипотезу Но на уровне 


значимости Альфа. 


Двухвыборочный Е-тест для дисперсии 
Переменная 1 Переменная 2 


Е Статистика Е 
Р(Е<=#) односто оннее 


Е критическое одностороннее ЕазпА-1зпв-1 
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Н анализа нет, то можно вое. 
ойки Пакет & ФТЕСТ массив 
массив 2) мастера функций +, пакета ось в | 
массив 9 — это ссылки на ячейки, содержащие значения ‚_— 
двух выборок. Функция ФТЕСТ выдает значение довери. 
тельной вероятности р для принятия Но при двусторонней 
проверке. Затем исследователь решает, устраивает ли его 
такое значение доверительной вероятности. 


Если же надстр! : 
ие 
пользоваться статистической функц 


$ 2.6. СРАВНЕНИЕ СРЕДНИХ ВЕЛИЧИН 
ДВУХ ВЫБОРОК ПРИ ИЗВЕСТНЫХ 
ГЕНЕРАЛЬНЫХ ДИСПЕРСИЯХ 


Часто исследователя интересует, одинаковы или нет сред- 
ние величины двух выборок, взятых из двух нормальных 
генеральных совокупностей. При этом известны генераль- 
ные дисперсии о1? и 027, 


Но: а1 = а> (генеральные средние равны), то есть 


На: а! # а>. 

Граничные точки: 2а (для правосторонней проверки), 
—2а (для левосторонней проверки), +2. (для двусторонней 
проверки). Значение ?а_находим по таблице (см. $ 1.1). 
Статистика 2 = жа Я их 

ее, где Ху иХ) — выбо- 
©1 Ипл я 92/по 


рочные средние этих выборок. 


Пример 12. Автома, 


тТи автомат 2 
ки. Стандартные отклон. 


фасуют чай в пач- 


ения 91 =1гис, 2 

Е ЛЬ НЫ - 
венно. В случайной выборке объема Ва о и м 
томата 1 средний вес Х! = 101 г. В случай м - 


ема по = 


Но: а1 =а> (средний вес о 

динаков), т 
Ни: а: # а. ), то есть 1-48 =0. 
Проведем двустороннюю проверку 


а=(1-—р)/2=(1-0,95)/2= 0,025 ы: 


ные точки 1,96. — 1,96 => гранич- 


Статистика 2 = 


А _ _ 101-98 
ха: — 
©1?/п1 + 02?/пь 12/20 + 52715 5,33. 


12/20 +2 


Г9- 


ааа 


Отметим значения на числовой оси. 


Отклоняем гипотезу Но и принимаем гипотезу Н\ на 


уровне значимости 5%. Средний вес пачек чая для этих 
автоматов различен. 


Задача 12. Автомат 1 и автомат 2 фасуют чай в пач- 
ки. Стандартные отклонения о1 = 0,5 ги о) = 1 гр. соот- 
ветственно. В случайной выборке объема п1 = 12 пачек для 
автомата 1 средний вес Х| = 81 г. В случайной выборке 
объема пэ = 16 пачек для автомата 2 средний вес Хх. = 80 
гр. Верно ли, что оба автомата фасуют чай в пачки одина- 
кового среднего веса? Доверительная вероятность р = 99%. 


$ 2.6.1. Двухвыборочный 2-тест для средних 
` (Ехсе 


Ехсе! позволяет провести испытание гипотезы о равенстве 
средних двух нормальных распределений с известными ге- 
неральными дисперсиями. 

Сервис — Анализ данных — Двухвыборочный 2-тест 
для средних -> ОК. Раскроется диалоговое окно, которое 
нужно заполнить. В графе Интервал переменной 1: указы- 
вается ссылка на ячейки, содержащие значения первой вы-, 
борки. В графе Интервал переменной 2: указывается ссыл- 
ка на ячейки, содержащие значения второй выборки. 

Если первая из ячеек содержит пояснительный текст, то 
рядом со словом Метки нужно поставить «галочку». В гра- 
фе Альфа указывается уровень значимости 1—р (по умолча- 
нию там уже указано 0,05, но исследователь может выбрать 
и свое значение). В графе Гипотетическая средняя раз- 
ность: пишем 0. В графах Дисперсия переменной 1 (извест- 
ная): и Дисперсия переменной 2 (известная.): указываются 
значения о1? и 02? соответственно. Также указываются пара- 
метры вывода (Выходной интервал, Новый рабочий лист, 
Новая рабочая книга) -> ОК. Откроется итоговое окно. 

В графах Р(2<=2) дано значение уровня значимости для 
односторонней и двусторонней проверок. Если это значе- 
ние меньше заданного Альфа, то гипотеза Но отвергается. 
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=, 


\ 


дних 


С ля сре 
ее чный 2-тест д? 
Двухвыборо Переменная 1 Переменная 
Среднее 012 02° 


сия 
Известная диспер пл. по 


Наблюдения 0 


средних 
потетическая разность 
г Статистика 2 


Р(7< 2) односторонняя 

стороннее а дносто- 
ое одност 2а для одност 

2 критическ, д 


роз ое 


вусто- 
2 критическое двустороннее 2о, длЯ ДВУ 
ронней проверки 


$ 2.7. ИСПЫТАНИЕ ГИПОТЕЗЫ 
ПО ВЫБОРОЧНЫМ СРЕДНИМ ПРИ НЕИЗВЕСТНЫХ 
ГЕНЕРАЛЬНЫХ ДИСПЕРСИЯХ 


Нужно определить, взяты ли две выборки объема п! и п› 


соответственно из нормальных генеральных совокупностей 
с одинаковыми средними. 

Но: а1 = 
аа: =0. 
и Х.— выборочные средние для первой и второй 

р соответственно, 81 И 82° — ‘выборочные дисперсии 
для первой и второй выборок соответственно. Вид гранич- 


а2 (генеральные средние равны), то есть 


2.7.1. С й 
5 лучай равенства генеральных дисперсий 
По таблице +-распределе 


точки: Тата +по-2 (для пр 
(для левосторонней проверки) + 


ни. 
я находим отп. Граничные 


роверки), — {м1 +и.-2 


ней проверки). ‘азп1+п.-2 (для двусторон- 
Статистика & = Хх,” 
п 2 (+ >) 
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Статистик 


10х11 
10+ 


Отметим з 


Пример 13. Для производства каждой из п1 = 10 дета- 
леи по первой технологии было затрачено в среднем 
Х: = 30 с (выборочная дисперсия 31? = 1 с?). Для производ- 
ства каждой из по = 16 деталей по второй технологии было 
затрачено в среднем Х› = 28 с (выборочная дисперсия 
32° =2с'). Можно ли сделать вывод, что по первой техно- 
логии требуется в среднем больше времени для производст- 
ва одной детали? Доверительная вероятность р = 95%. 


И. 


Применив результаты $ 2.5, получаем, что неизвестные 
генеральные дисперсии равны. 

Но: а1 =а2>. 

Н1: а1>а>. 

Проведем правостороннюю проверку. 

а=1-р=1-0,95=0,05 = #.и.+ио-2 = 10,05;10+16-2 = 1,711. 
Это граничная точка. 


Статистика # = 


я т 10%1+16Ж2 [1 1 
р 10+16—2 


Отклоняем гипотезу Но и принимаем гипотезу Н1 на 
уровне значимости 5%. По первой технологии требуется в 
среднем больше времени для производства одной детали. 


Задача 13. Для производства каждой из п! = 12 дета- 
ервой технологии было затрачено в среднем 


лей по п к 

й Х, = 95 с (выборочная дисперсия 81? = 1,5 с’). Для произ- 
|. 2й каждой из п2 = 11 деталей по второй технологии 
водства о . 

ые было затрачено в среднем Хо = 23 с (выборочная диспер 
Е сия 322 = 2 с?). Можно ли сделать вывод, что по первой тех- 
т Ё коней требуется в среднем больше времени для произ- 


ро" водства одной детали? Доверительная вероятность р = 99%. 


2.7.1.1. Двухвыборочный тест с одинаковы, 
$ 2.7.1.1. дисперсиями 


Ехсе] позволяет провести испытание а > Равенеть 
средних двух нормальных распределен? равенст. 
ва неизвестных генеральных а _ 
Сервис > Анализ данных -> Двухвыборочный 1-тест 
одинаковыми дисперсиями -> ОК. Раскроется диалоговое ок. 
но, которое нужно заполнить. ОК. Откроется итоговое окно, 


Двухвыборочный {$-тест с одинаковыми дисперсиями 


Переменная 1 Переменная 2 


Среднее Хх Х. 
Дисперсия 81° 327 
Наблюдения п п 
Объединенная дисперсия 

Гипотетическая разность средних 0 

ЧЕ п +12-2 
122 - 


{-статистика 


Статистика # 


Р(Т<=® односторонняя 
$ критическое одностороннее Топ +по-2 для 


односторонней 
проверки 
Р(Т<=® двусторонняя 
$ критическое двустороннее й 


0;п1+п2-2 ДЛЯ 
двусторонней 
проверки 


В графах Р(Т<=+) дано знач. 
односторонней и двусторонн 
ние меньше заданного Альф 


ение уровня значимости для 
еи проверок. Если это значе- 


:. а, то гипотеза Но отвергается. 
Если надстройки Пакет анализа нет, то можно восполь- 


зоваться статистической функцией ТТЕСТ (массив 1; мас- 
сив 2; хвосты; 2) мастера Функций &, пакета Ехсе]. Для од- 
носторонней проверки хвосты 


— 1, для двусторонней про- 
верки хвосты = 2. Функция ТТЕСТ выдает а уровня 


значимости, которое нужно сравнить с соответствующим а. 


$8 2.7.2. Случай неравенства 


генеральных 
дисперсий р 


В этом случае лучше об 


ратиться к Па 
при п! > 30 ип. > 30 м 


кету анализа. Но 
ожно примени 


ТЬ следующую схе- 
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—ы=— 


ва кажд 
затрачено 
2 = 38) 


ва одной д 


Примени! 
тенеральные 
Но: а1= а 
Нл: аа>2а 
Проведем 
01 ры 


ка. х < 
Е аа № 


му. Граничные точки: 2; (дл 
—2а (для левосторонней пров 
проверки). Значение 2. нахо 


я правосторонней проверки), 
ерки), +2. (для двусторонней 
дим по таблице (см. $ 1.1). 


ие = = 
аа - 2 
Статистика 2 ‚ где Х1иХ. 


Уз — 0+ 57а) 
выборочные средние этих выборок. 


Пример 14. Для производства каждой из п! = 51 дета- 
ли по первой технологии было затрачено в среднем 
Х; = 30 с (выборочная дисперсия 31? = 6 с). Для производ- 
ства каждой из по = 41 детали по второй технологии было 
затрачено в среднем Хо = 25 с (выборочная дисперсия 

? = 3 с"). Можно ли сделать вывод, что по первой техно- 
логии требуется в среднем больше времени для производст- 
ва одной детали? Доверительная вероятность р = 95%. 


Применив результаты $ 2.5, получаем, что неизвестные 
генеральные дисперсии различны, 

Но: а1=а>. 

Ну: а1>а?. 

Проведем правостороннюю проверку. 

©=1-р=1-—0,95=0,05 = 2.=1,645. Это граничная точ- 
ка. 


Х! ее Х. 
Статистика = 


\1*/(п1 — 1) + 827/(п>- 1) 


[а ое 


№ 6/(51-1) + 3/41 -1) 


Отметим значения на числовой оси. 


Мы отклоняем гипотезу Но и принимаем гипотезу Н! на 
уровне значимости 5%. По первой технологии требуется в 
среднем больше времени для производства одной детали. 


Задача 14. Для производства каждой из п! = 51 дета- 
ли по первой технологии было Затозяено в среднем 
Хх! = 32 с (выборочная дисперсия 31° = 9 с ). Для производ- 
ства каждой из по = 41 детали по второй технологии было 
затрачено в среднем Х2 = 28 с (выборочная пистереия 
82? = 4 с?). Можно ли сделать вывод, что по вы 
логии требуется в среднем больше времени для а д 
ва одной детали? Доверительная вероятность р 5. 


й +-тест с различным 
„7.2.1. Двухвыборочный * 
но а дисперсиями 


Ехсе| позволяет провести испытание гипотезы Ге) равенстве 
средних двух нормальных распределений В случае нера. 
венства неизвестных генеральных дисперсий. . 

Сервис -> Анализ данных > Двухвыборочный #-тест 
различными с дисперсиями -— ОК. Далее см. $ 2.7.1.1, Для 
этого случая ТТЕСТ/массив 1; массив 2; хвосты; 3). 


$ 2.8. ИСПЫТАНИЕ ГИПОТЕЗЫ ПО ДВУМ 
ВЫБОРОЧНЫМ ДОЛЯМ 


Нужно определить, взяты ли две выборки большого объе- 
ма (п; > 30, П? > 30) с выборочными долями р] и ро из ге. 
неральных совокупностей с одинаковой генеральной долей, 
Но: р: = Р2 (генеральные доли одинаковы). 
Граничные точки: га (для правосторонней проверки), 
—2а (для левосторонней проверки), +2, (для двусторонней 
проверки). Значение 2а находим по таблице (см. $ 1.1. 


Статистика 2 = я ‚гдер — выборочная 
г 1 1 
1- Е + т) 
БА -— р) в. 


доля для объединенной выборки. 


ные эффекты. Можно ли утверждать, что побочные эффек- 
ты от нового лекарства у женщин возникают чаще, чем у 
мужчин? Доверительная вероятность р= 95%. 


Выборочные доли В1 = 50/3000 = 0,017, р. = 110/3500 = 
= 0,031. 

Но: р1=рэ (генеральные доли одинаковы). 

1: Р1 < ро. 

Проведем левостороннюю проверку. 

и рт 090 > 1,645 > граничная точ. 
ка —1,645. Выборочная доля для объединенной выборки 
равна (50 + 110)/(3000 + 3500) = 0,025, 

Статистика г = Е. = 

1-5 +1] 
п п2 
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0,017—0,031 


0,025 (1 - 0,025) Е 
3000 3500 
Отметим значения на числовой оси. 


Отклоняем гипотезу Но и принимаем гипотезу Н1 на 
уровне значимости 5%. Побочные эффекты от нового ле- 
карства у женщин возникают чаще, чем у мужчин. 


Задача 15. Проводились испытания нового лекарства. 
В эксперименте участвовали п1 = 2000 мужчин и по = 2500 
женщин. У 40 мужчин и 70 женщин наблюдались побоч- 
ные эффекты. Можно ли утверждать, что побочные эффек- 
ты от нового лекарства у женщин возникают чаще, чем у 
мужчин? Доверительная вероятность р = 99%. 


$ 2.9. ИСПЫТАНИЕ ГИПОТЕЗ ПО СПАРЕННЫМ 
ДАННЫМ 


Иногда выборки не являются независимыми из-за нали- 
чия факторов, влияющих на выборки неизвестным путем. 
Тогда группируют элементы попарно (по одному из каж- 
дой выборки) и проводят испытание гипотезы на среднюю 
разностей между парными измерениями. 

Пусть п — объем парной выборки. В каждой паре нахо- 
дим 4 — разность значений. Для полученных разностей 
ищем выборочную среднюю Х д и выборочное стандартное 
Е а. По таблице {-распределения находим т: 

Граничные точки: #а;и-1 (для правосторонней провер- 
ки), — Та:п-1 (для левостороннеи проверки), аи (для 


двусторонней проверки). 


Е а : 
Статистика $ г 7 1—1 


Можно ли утверждать, что шины заводов 
ость? Доверительная 


Пример 16. й 
1и ити разную износоустойчив 


вероятность р = 95%. 
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ее; 


У — расстояние 2 е. 
те ах для шин завода 2, а=Х-У 
тыс. км тыс. км 


Ха=Са)/п=3,9/5 = 0,78. 


за’ =(24)/п —(Ха)' = 81,33/5 — 0,18? = 5,6576. 


5а = 2,319. Среднее ы 
Но: средняя а =0 (нет разницы между шинами). Дисперси 
Н1: ав* 0 (есть разница) Наблюдени 
Проведем двустороннюю проверку. Корреляци: 
а = (1 —р)/2 = (1 сы 0,95)/2 — 0,025 => Тат-1 = 10,025;5-1 = Е Типотетичес 
= 2,776 > граничные точки +2,776. ЧЕ 


| 4& 
сы = о = 1,311. | фотатистик: 
з/Мп-1 2,379/5—1 


Р(Т<=$) одн 
Отметим значения на числовой оси. | $ критическ, 


Статистика # = 


Мы принимаем ги 
Износоустойчивость 


потезу Но на уровне значимости 5%. 
шин одинакова. 


Задача 16. 


Можно ли Утверждать, что шины заводов 
зную износоустойчивость? Доверительная 
вероятность р = 99%. 


Х — расс: ‘ояние а расстояние 
для шин завода 1, | для шин завода 2, 


[ва ее 


8 2.9.1. Парный двухвыборочный +-тест 
для средних 


Ехсе! позволяет провести парны 
данных — Парный двухвыборочн 
ОК. Раскроется диалоговое окн 
нить. ОК. Появляется итоговое о 


Й тест. Сервис -> Анализ 
ый 1-тест для средних > 
о, которое нужно запол- 
кно. 


Парный двухвыборочный $-тест для средних 


Е ВНЕ К 


Переменная 1 Переменная 2 


Среднее Хх, о 

Дисперсия 

Наблюдения п п 

Корреляция Пирсона 

Гипотетическая разность средних ад _ 

ЧЁ и — 1. 

{-статистика Статистика # 

Р(Т<=%) односторонняя 

$ критическое одностороннее а:п-1 ДЛЯ ь 
односторонней 

проверки 


Р(Г<=4) двусторонняя 
$ критическое двустороннее Та;п-1 ДЛЯ 

двусторонней 
проверки 


В графах Р(Т<=+) дано значение уровня значимости для 
односторонней и двусторонней проверок. Если это значе- 
ние меньше заданного Альфа, то гипотеза Но отвергается. 

Если же надстройки Пакет анализа нет, то можно вос- 
пользоваться статистической функцией ТТЕСТ (массив 1; 
массив 2; хвосты; 1) мастера функций Ё,, пакета Ехсе]. 


$ 2.10. 'НЕПАРАМЕТРИЧЕСКИЕ ИСПЫТАНИЯ 


До сих пор мы предполагали, что генеральные совокупнос- 
ти распределены нормально или приблизительно нормаль- 
но. Теперь мы откажемся от этих условий. Будем проверять 
гипотезу о наличии связи между значениями двух величин. 
Но: нет связи между значениями двух величин. 
Нт: есть связь между значениями двух величин. 
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Составляется таблица наблюдаемых и По стро. 
кам изменяются значения первой велич › столбцан 
— значения второй величины. В клетке с индексами (1, Л 
записана частота /о = п; — Число элементов, у которы, 
значения первой и второй величин равны Г и ] соответст. 
венно. /о› — наблюдаемая частота события. 

По таблице наблюдаемых частот строят показанным 
далее способом таблицу ожидаемых частот. [Е — ожида. 
емая частота события. Должно выполняться условие 
15 > 5 для каждой клетки таблицы, иначе надо объединить 
какие-то строки или столбцы. 

Таблицу наблюдаемых частот и таблицу ожидаемых час- 
тот часто называют таблицами сопряженности. Пусть п — 
общее число наблюдений. т = (число строк таблицы — ух 
Х (число столбцов таблицы — 1). Если таблица сопряжен- 
ности содержит только одну строку, то т = число столбцов 
таблицы - 1. 

Доверительная вероятность р, уровень значимости 
а = 1 -р. Для аи т по таблице Х*-распределения нахо- 
Дим т. Это граничная точка. 


8 2 
Статистика у? = №. 
ТЕ 
Если таблица сопряженности имеет размер 2Ж2, то вво- 
дится поправка Йетса; у? = х®- 0,5) 
Е 
оси. Для нахождения 
тистической функцией 
Ё, пакета Ехсе]. 
Пример 17. Студенты сдавали экзамены по математике 
и физике. Есть ли связь между результатами экзаменов? 


Результаты Резуль 

таты 
экзамена по Ультаты экзамена по физике 
математике [ пять | 


Отметим значения на числовой 
Ха т можно воспользоваться ста 
ХИ2ОБР(<; т) мастера функций 


четыре [| три | два | 
пь | 25 | 18 | 10 | 
В РОТ 
И Е В О 
м В 


Приведенная таблица — это таб 
тот /о. В клетке (1, 1) написано число 25, то есть 25 сту- 
дентов получили и по физике, и по математике отличные 
оценки. В клетке (4, 2) написано число 10, то есть 10 сту- 
дентов получили хорошие оценки по физике и неудовле- 
творительные оценки по математике. И т. д 


лица наблюдаемых час- 
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Е Ц : нет св ме; ее 
Ми ( ыы Но Язи между оценками по математике и физи- 
‘оте,? ке. 
к к Н1: есть связь м 
ЗТвек, 1. ежду оценками по математике и физи- 
\, ке. 
зан Построим таблицу ожидаемых частот {к. Для этого сум- 
о мируем числа по строкам и столбцам. 
И, 
ло отр Результаты экзамена по физике 


математике 


четыре 


ЫХ час. 


ТЬ п о 
`— 1) х 
РЯжен. Всего получены результаты экзаменов п = 225 студен- 
олбцоз тов. Отличный результат по математике показали 58 сту- 
дентов, то есть доля тех, кто получил отличные оценки по 
тМоСти математике, равна 58/225. Если верна гипотеза Ну, то 
` Нахо. можно ожидать, что 58/225 из 68 студентов, получивших 
. по физике отличные оценки, показали отличные знания и 
по математике. 
Аналогично можно рассчитать и другие ожидаемые ча- 
] стоты. 
© с, Результаты Результаты экзамена по физике нра 
| ее 
68%58/225| 64Х58/225] 54Х58/225 [39Ж58/225| 58 | 
дения 68Х57/225| 64Ж51/225| 54Ж57/225 [39%51/225| 57 
‹пией три 68%70/225| 64х70/225| 54Ж10/225 [39х70/225| 70 
". два 68х40 64Х40/225| 54%40/225 |39%40/225| 40 | 
Гоа [68 ом о № [225 
и Ожидаемые частоты нельзя округлять до целого значе- 
ния. 
Результаты - Результаты экзамена по физике 
четыре Я 
ее и Е: РО НИ 
о а | 
| а а Ю 
два 
чае ЗОН ВО аВЕ ЯВ В 
сту Если в какой-то клетке получилось значение, меньшее 
5 5, то с целью уничтожения этого в таблицах нужно объе- 
ти - ли столбцы. При округлении на- 
с рю РЗ 2 ы не изменились 
вле ‚до следить, чтобы исходные сумм 
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хе 95, уровень Значимост 
| ‚роятность р = 0, ы и 

Дориан 05. т= (число = Пх 
ВЕ р ›9 ? = (2-0 @е-1-9. 

ов таблицы — 1) 

х о по таблице Х?-распределения „Находим 
жа ЕЕ Х..05:0 = 16,92. Это граничная точка. Найдем зна. 
С, ат а . 


о 
чение статистики Х.. 


Поясним, как заполняется таблица. Наблюдаемые час- 
тоты /о пишем в 1-м столбце, а соответствующие им ожи- 
даемые частоты {р — во 9-м столбце. Далее производим над 
столбцами действия, указанные в 1-й строке. 


— 24,40 (сумма чисел 5-го 
столбца). Отметим значения на числовой оси. 


Статистика у? = х 4-1 
ТЕ 


— ХИРТЕСТ. Появляется диалоговое окно. В графе фак- 
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9,51 


24,40 


даемые час: 
гие им ожи: 
язводим на 


‚ чисел 5-70 


тический интервал у 


казывается ссылка на ячейки, в ко- 
торых хранятся наблюдаемые частоты. В графе ожидае- 
мый интервал указывается ссылка на ячейки, в которых 
хранятся ожидаемые частоты. ОК. Если полученное значе- 


ние превышает уровень значимости а = 1-р, то гипотеза 
Но отклоняется. 


Задача 17. Студенты сдавали экзамены по математике 
и физике. Есть ли связь между результатами экзаменов? 
Доверительная вероятность 99%. 


Результаты 
экзамена по 
математике пять | четы 


Результаты экзамена по физике 


Глава 3 
———=—„ЗЧЗА— 


ПАРНАЯ ЛИНЕЙНАЯ 
РЕГРЕССИЯ 


Очень часто исследователя интересует связь между пере. 
менными. Это помогает при анализе их поведения. Нач. 
нем с двух переменных, а в следующей главе рассмотрим 
случай многих переменных. Будет разработана модель для 
описания связи между переменными с математической точ- 
ки зрения. Начнем с наиболее простых для анализа линей- 
ных уравнений. 


$ 3.1. ПРОСТАЯ МОДЕЛЬ ЛИНЕЙНОЙ РЕГРЕССИИ 


Существует или нет линейная связь между двумя перемен- 
ными х, у? Проводим случайную выборку. При значениях 
1, Х2, ..., хп мы наблюдаем значения Ут, У, ..., Уп СООТ- 
ветственно. На плоскости Оху отметим точки с координа- 
тами (х1, У1), (хо, 2), ---› (Жи, Уп). 


Предположим, что точки группируются вокруг некото- 
рой прямой линии у =а + Вх. Тогда: 


Точки не находятся точно на линии у = 
неудивительно. Ведь помимо х на поведени 


влияние и другие факторы. Дальнейший а 
ного уравнения позволяет сказать, 


а + 6х. Но это 
е у оказывают 
нализ получен- 
насколько сильно влия- 
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перемет: 
тачениях 

Уп соот: 
оордина 


` некото 


Пример 18. Изучас 
зучается зависимость себестоимости еди- 


ницы изделия р 
(у, тыс. руб.) от величины выпуска продук- 


ции (х, тыс. шт.) по гру 
и . Уппам предприятий тчетный п 
: ц ий - 
риод. Экономист обследовал п = 5 2 Зы: 


следующие результ й Е - 
Е льтаты (1-й и 2-й столбцы). Полагая, что 
ыми х, у имеет место линейная зависимость, 


едель 
определим выборочное уравнение линейной регрессии. 


Заполним таблицу. 


5Ж32,5 —20Ж8,4 
= — = -0,11. 
5Ж90- 202 


п 
и Бух; 


а 1=1 


у=а + 6х = 2,12 + (-0,11)х. 


Задача 18. Фирма провела рекламную кампанию. Че- 
рез 10 недель фирма решила проанализировать эффектив- 
ность этого вида рекламы, сопоставив недельные объемы 
продаж (у, тыс. руб.) с расходами на рекламу (х, тыс. руб.). 


Полагая, что между переменными х, у имеет место ли- 


нейная зависимость, определить выборочное уравнение ли- 


нейной регрессии. 

Замечание. Вместо вычислений коэффициентов а и Ь по 
о воспользоваться соответственно статис- 
ОТРЕЗОК (изв_знач_у; изв_знач_х) 
и НАКЛОН (изв_знач_У; изв _знач_х) мастера функций 1, 
пакета Ехсе]. Здесь изв_знач_У и изв_знач_х — это ссыл- 
ки на ячейки, содержащие значения переменных у их со- 


ответственно. 


формулам можн 
тическими функциями 
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Обозначим через и = — 
ния переменных и и х соответственно. 


$ 3.2. ОШИБКИ 


= выборку. При значениях 1, хо, Е 
Проводим случайную р на п 
мы наблюдаем значения у1, у», ..., У» соответс ННо. По. 
лучено уравнение 7 = а + 6х. Если вместо ья подставить В 


это уравнение значения х1, хо, ..., х„, то будут получены 
значения 11, ..., )„, которые, вообще говоря, будут отли. 
чаться от у1, уз, ..., у„. Разница У: — И; = е; называется 


ошибкой (остатком, отклонением). Значения коэффициен- 

тов аифв уравнении ута+ 5х, которые рассчитывались 

по приведенным в $ 3.1 формулам, подбирались так, чтобы 
п 


минимизировать сумму Уе. Говорят, что они получены 
= 
методом наименьших квадратов (МНЕ). 


8 3.3. КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ПИРСОНА. 
КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ 


Мы хотим знать, насколько Хорошо приближает наши дан- 
ные линейная модель. у,— У=(и:-й)+(9,— =(й-уче. 


} Необъясненная 
вариация 


Объясненная 
вариация 


ча 


Формула у =а + 6х только части 


° Но ведь на у 
“КРыто в остатке 


о-в =0, М. так 
ой ;. ЕЕ 
для каждой точки д, 2 7)? — это общая вариация по. 


ременной у. 2-9: — это вариа 
= 


рая объясняется формулой у=а+ вх. 5 


влияют и другие факторы. Их влияние 
е:. Если бы связь была строго линейной 
п 
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переменной ‹о 
риация У, которая ы 
у=а+ 6х. рая не объясняется формулой 


Введем характеристик, „2 _ 
рактеристику г? = — коэффициент 


детерминации. Эта мера показ 
переменной у, которая объясня 
личии линейной связи этих величин. В случае строгой ли- 


неиной зависимости между хи У г" =1. Если зависимость 
между х и у отсутствует, то г? = 0. 


Коэффициент корреляции Пирсона: 
п 


ется переменной х при на- 


п п п 
пухи Ба Уж, 
121 121 (< 1. 


п о п 2 п п 2 
изя (= ихи- (и) 
1=1 {=1 1=1 1—1 

Вторая дробь — удобная расчетная формула, которую 
чаще всего используют. 

Коэффициент корреляции Пирсона г" содержит инфор- 
мацию о поведении у с ростом х. Знак коэффициента кор- 
реляции Пирсона Г совпадает со знаком коэффициента 6. 
Чем ближе гк 1, тем ближе связь между х и ук линей- 
ной. При г = 0 линейной связи между х и у не существует 
(но, возможно, между х и у есть другая зависимость). 

Пример 19. Найдем остатки е;, коэффициент корреля- 

ции Пирсона и коэффициент детерминации в примере 18. 

у =2,12:— 0,11% 


п р п 2 у 8-м 
ори (н)хези- 
5Ж32,5—20Ж8,4 = 0,904. 
(5Ж90- 202)(5 Х 14,26 — 8,42) 


С идетельствуе 
чение близко к —1, ЧТО СВИД Ует об 
ое й связи (с ростом х значения 
сильной отрицательной с — 
и И. 
вают). Знаки 6 2 — (-0,904)? = 0,817, то есть 8] ту 
циент детерминации Г , а ‚7% 
общей вариации себестоимости У зав т Уска про, 
дукции х. Наша модель не объясняет 18,3% вариации с 
бестоимости. Эта часть вариации объясняется Факторани, 

не включенными в модель. 
Задача 19. Найти остатки е;, коэффициент корреля. 
ции Пирсона и коэффициент детерминации в задаче 18. 


Замечание. Для вычисления коэффициента корреляции 
Пирсона можно воспользоваться статистическими функци. 
ями ПИРООН (массив 1; массив 2) или КОРРЕЛ (массив 1; 
массив 2) мастера функций Ё, пакета Ехсе|. Массив 1и 
массив 2 — это ссылки на ячейки, содержащие значения 
переменных. Для вычисления коэффициента детермина- 
ции можно воспользоваться статистической функцией 
КВПИРСОН (изв_знач_у; изв_знач_х). 


Очень 
У Убы. 


—0,11 иг = -0,904 совпадают. К 


$ 3.4. ПРЕДСКАЗАНИЯ И ПРОГНОЗЫ НА ОСНОВЕ 
ЛИНЕЙНОЙ МОДЕЛИ РЕГРЕССИИ 


Мы можем воспользоваться по 


хождения значения у при известном значении х. Модель 
строилась по значениям а. 52 им. Поэтому поиск зна- 
чения у для х из интервала о) называется предсказа- 
нием, а поиск значения У для х вне интервала (х1, х„) на- 
зывается прогнозом. Чем дальше расположен х от интерва- 
ла (х1, х„), тем менее точным будет прогноз. 

Пример 20. Найдем ожидаемое значение себестоимос- 

ти у при выпуске продукции х — 5,5 тыс. шт. 
у = 2,12 -— 0,11х. 


Тогда У(5,5) = 2,12 — 0,11Ж5,5 = 
Задача 20. й 


строенной моделью для на- 


в задаче 18. 


Замечание. Для прогноза значений переменной у мож- 
но воспользоваться статистической функцией  ТЕНДЕН. 
ТЕ Аж У; изв_знач_л; нов знач_х; кон ) ма- 
стера функций {, пакета Ехсе]. ПГ отант® гай 
ми яченки, содержащие значения переменной , и 

‚ 
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ОСНОВЕ 
| 


ьЮ ДЛЯ Н: 
х. Модель 
поиск ЗН 
предска 
Х1,» В) на: 
т интервй 


тоимоб” $ 


рых ищется прогноз. 
станта = 0, то Коэффициент а — 0. 
ям переменных х, у Функция сам 


прямой линии и дает прогноз. Функцию ТЕНДЕНЦИЯ 
можно использовать Ив случае множественной линейной 
регрессии. Для парной линейной регрессии можно восполь- 
зоваться и статистической функцией ПРЕДСКАЗ 


(<; изв_знач_у; изв знач _%), где х — это значение пере- 
менной х, для которого ищется прогноз. 


Если необязательный аргумент кон- 


По известным значени- 
а подбирает уравнение 


$ 3.5. ОСНОВНЫЕ ПРЕДПОСЫЛКИ МОДЕЛИ 
ПАРНОЙ ЛИНЕЙНОЙ РЕГРЕССИИ 


Основные предпосылки: 


1) связь между переменными Хх, у. является линейной; 

2) независимая переменная х может быть использована 
для прогноза у; 

-3) остатки (то есть ошибки) нормально распределены; 

4) для всех данных х математическое ожидание ошиб- 
ки равно нулю и дисперсия ошибки постоянна; 

5) ошибки независимы. 


$ 3.6. ИСПЫТАНИЕ ГИПОТЕЗЫ ДЛЯ ОЦЕНКИ 
ЛИНЕЙНОСТИ СВЯЗИ 


Между переменными х, у предполагается наличие линей- 
ной связи у = а + Вх + =, где ошибка = — это отклонение 
значения у от линии у =а + Вх. Мы производим парную 
выборку значений переменных х, у и методом наименьших 
квадратов получаем оценки коэффициентов аивВ—-аиб 
соответственно. Очевидно, что для другой выборки оценки 
Чи будут другими. Как, зная оценки а и , убедиться, ео 
связь между переменными х, у действительно линейная? 


3.6.1. Испытание гипотезы для оценки 
о связи на основе оценки коэффициента 
корреляции в генеральной совокупности 


Показатель наличия линейной связи в генеральной сово- 
Купности — это коэффициент корреляции. Для ть 
Ной совокупности он равен р. Нам это ль Е 
н0. По данным выборки мы получаем оценку 
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. ляции Г — И На основан 
ЕВ а ии линейной [а 
проводим испытание г неральной совокупности Н Зи 
между переменными х, у вте р с а 
вывод о наличии линейной связи между пер ми х. 
в генеральной совокупности зависит от объема ВЫборки, 
Чем больше объем нашей выборки, тем надежнее получен. 
а есть между переменными х, У отсутствует 
линейная связь в генеральной совокупности. 

Ну: р ® 0, то есть между переменными х, у есть линей. 
ная связь в генеральной совокупности. 

Задается доверительная вероятность р. Пусть п — объ. 
ем парной выборки. Двусторонняя проверка. © = (1- 2)/2. 


По таблице #-распределения находим Фа;п—2. Граничные 
точки Ето. 


Статистика #=\/12(п- 2)/(1 = г?). 


Пример 21. Вернемся к примерам 18, 19. Проверим 
гипотезу о наличии линейной связи между переменными 


х, у в генеральной совокупности. Доверительная вероят- 
ность р = 95%. п =5. 


Но: р = 0, то есть между переменными х, у отсутствует 
линейная связь в генеральной совокупности. 

На: р * 0, то есть между переменными х, у есть линей- 
ная связь в генеральной совокупности. 

Проведем двустороннюю проверку. 


а=(1-р)/2 = (1-—0,95)/2 = 0,025. По таблице $-распре- 
деления находим Фото = 


ки +3,182. 20,025;5-2 = 3,182. Граничные точ- 


С нЕ #=\ 2)/(1—:2) = 0,8175 —2)/а-— 0,817) = 


Отметим значения на числовой оси. 


У Нои принимаем Н 

гипотезу Н! 

на уровне значимости 5%. Между переменными х у есть 
, 


линейная связь в генеральной совокупности 


Задача 21. В задачах 18, 1 
личии линейной связи между пе 
ной совокупности. Доверительн: 


9 проверить гипотезу о на- 
ременными х, у в генераль- 
ая вероятность р = 99%. 
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основе показателя 
ОЙ регрессии 


между переменными х, у есть линей- 
ной совокупности. 

Задается доверительная вероятность р. п — объем пар- 
ной выборки. Двусторонняя проверка. а = (1—р)/2. 


По таблице {-распределения находим {,.„_о. Граничные 
точки Е%,„_. у 


ная связь в генераль 


Дисперсия распределения остатков вдоль линии регрес- 
Уе 
сии 5? = к 5 — стандартная ошибка. 
Стандартная ошибка коэффициента 6: 
Ре 5 5 


| (а —*)? р = Ри 
11 #1 


ь линей ы 
Статистика # = В/5ь. 

р Пример 22. Вернемся к примерам 18, 19. Проверим 
-распре- гипотезу о наличии линейной связи между переменными 
гые точ- Хх, 9 в генеральной совокупности. Доверительная вероят- 

ность р = 95%. п = 5. 
0,817) Но: В = 0, то есть между переменными х, у отсутствует 
линейная связь в генеральной совокупности. 
Ну; В 7 0, то есть между переменными х, у есть линей- 
ная связь в генеральной совокупности. 
Проведем двустороннюю проверку. 
а=(1-—р)/2 =(1-0,95)/2 = 0,025. 
По таблице #-распределения находим ата = 1,0255-2 = 
= 3,182. Граничные точки +3,182. : 
'езУ и 
у в" 
› на- 
алр“ 
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2 1=1 = 0,027 = 0,009. 5 = 0, 5. 
59° = — Бо 


Е А 90 — 20°/5 


Статистика # = 6/ 5, = —0,11/0,03 = —3,667. 
Отметим значения на числовой оси. 


= 0,03. 


Мы отклоняем гипотезу Ну и принимаем гипотезу Н\ | 
на уровне значимости 5%. Между переменными х, у есть -0 
линейная связь в генеральной совокупности. 


Задача 22. В задачах 18,19 проверить гипотезу о на- 
личии линейной связи между переменными х,у в генераль- 


ной совокупности на основе показателя наклона. Довери- 
тельная вероятность р = 99%. . 


Замечание. Для расчета стандартной ошибки вместо 
п 


формулы 8 = 


— 2 МОЖНО воспользоваться статистичес- 
кой функцией СТОШУХ 
функций +, пакета Ехсе]. 


(изв_знач_ у; 


изв_знач_х) мастера 


8 3.7. ДОВЕРИТЕЛЬНЫ 


Е ИНТЕР 
В ЛИНЕЙНОМ ы 


РЕГРЕССИОННОМ АНАЛИЗЕ 


Проведя испытания гипотез ($ 3.6), мы пришли к выводу, 
что связь между переменными х, у линейна и задается не- 
известной нам формулой У -а + Вх. Мы производим пар- 
ную выборку значений переменных х, У и методом наи- 
меньших квадратов получаем оценки коэффициентов а и В 
— аи 6 соответственно. Получена Формула у =а + Ьх, ко- 
торои мы можем воспользоватьс 


Я для оценки значений у 
при заданном значении х. По полученным точе 
кам строят доверительные интервалы. Обычно 


тельные интервалы для показателя наклона ли 


это довери- 
нии линей- 
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‹и вместо 


тистичес- 


) мастера 


ной регрессии В, для средн 
значении Хх и для значе 


его значе 


ний у при за данном 
Задается доверительн я Е - 


‹ ная вероятность р. п 
выборки. © = (1 —Р)/2: По таблице {-рас 
ДИМ Фа;п—2. 


НИЯ У при заданном 
ачении х. 

— объем парной 
пределения нахо- 


Доверительный интервал имеет вид БЕ 
стандартная ошибка коэффициента 6. 


Пример 23. Вернемся к приме 
верительный интервал для показателя наклона линии ли- 
нейной регрессии. Доверительная вероятность р = 95%, 
В. _о25ь = —0,11 +3,182Х 0,03 = —0,11+0,10, то есть 

=0,2е= В < -0,01. 

Задача 23. В задачах 18 и 22 
интервал для показателя на 
сии. Доверительная вероятность р = 99%. 


о;п-25ъ, где Зь — 


рам 18 и 22. Найдем до- 


найти доверительный 


5 3.7.2. Доверительный интервал для среднего 
значения переменной у при данном значении 
переменной х 


Обозначим данное значение переменной х через хо. Дове- 
рительный интервал для среднего значения переменной у 
при хо задается формулой: 


у=а-+ 6жщ + Топ-28 


где 5 — стандартная ошибка. Е 
Чем больше величина |хо-Х|, тем шире доверительный 
интервал. 
Пример 24. Вернемся к примерам 18 и 22. 1 
верительный интервал для среднего значения жа 
У при заданном значений хо = 5,5 тыс. шт. Довер 
вероятность р = 95%. 
в 


=а+ 6х0 + 
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1, (5,54% 
+ 
-2,12-0,11Х5,5+3,182Х 0,095 90—20:/5* 


= 1,515 0,197. 


То есть доверительный интервал для среднего знач 
переменной у при заданном значении х0 = 5,5 тыс. ш 
вен (1,318; 1,712). 


Задача 24. В задачах 18 и 22 найти доверительный 
интервал для среднего значения переменной у при задан. 


ном значении х = 5,5 тыс. руб. Доверительная вероятность 
р = 99%. 


еНия 
т, ра. 


2 


8 3.7.3. Доверительный интервал 
для индивидуальных значений переменной у 
при данном значении переменной х 


Доверительный интервал. для индивидуальных значений 
переменной у при заданном хо равен: 


а + 60 + 1,25 


Пример 25. Вернемся к примеру 24. Найдем довери- 
тельный интервал для индивидуальных значений перемен- 


ной у при заданном значении хд = 5,5 тыс. шт. Довери- 
тельная вероятность р = 95%. 


—2,12— 0,11% 5,5 +3,182Х 0,095 |141. (5,54) _ 


5 90- 20/5 

= 1,515 + 0,361. : 

То есть доверительный интервал для индивидуальных 
значении переменной у при заданном значении ху = 5,5 
тыс. шт. равен (1,154; 1,876). Понятно, что доверительный 
интервал для индивидуальных 
ре доверительного интервала него значения пере- 
менной у (при заданном значении хо). 


’ доверительный интер- 
ии переменной У при за- 
уб. Доверительная вероят- 


вал для индивидуальных значен 
данном значении хд = 5,5 тыс. р 
ность р = 99%. 
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Глава 4 


МНОЖЕСТВЕННАЯ 


ЛИНЕЙНАЯ РЕГРЕССИЯ 


используют множественную ли- 


Вух: +... +В Ат + в, где & — 
это ошибка. Пусть и — число т : 


ясняющих переменных. Наш 


ры модели Во, В1, ..., Вт. Дл 
надежности требуется выпол 


УЕ 


8 4.1. ОСНОВНЫЕ ПРЕДПОСЫЛКИ МОДЕЛИ 


ери- МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ 
мен- 
5ри- Основные предпосылки: 


1) математическое ожидание случайного отклонения 2, 
равно нулю для всех наблюдений; 
2) дисперсии отклонений постоянны и равны для всех 


наблюдений; 
3) случайные отклонения независимы друг от друга; 
4)”. 4) случайное отклонение независимо от объясняющих 
2/5 переменных; 


5) модель линейна относительно параметров; 
6) между факторами отсутствует строгая линейная связь; 


д И случайные отклонения Апреле нормально с 
Я: ры параметрами 0 и о?: &; = №0, 0°). 
ЬН. 
‚ ши 
ФИЦИЕНТОВ 
Е. мно - иной МИНЕЙНОЙ РЕГРЕССИИ 
МЕТОДОМ НАИМЕНЬШИХ КВАДРАТОВ (МНК) 
: Й й Й - 
й. Рассуждаем аналогично случаю парной линеиной регрес 


аты наблюде- 
Е менных результ 
Я _ ИИ. Подетавляем вместо пере 


» находим остатки и минимизируем сумму КВадратоь 
нии, 


статков. Получаем бо, в) — ощенкя параметров и, 

о В, В Ви соответственно. Ограничимся случаем п 
ей 

о ай т > 2 будет разобран далее с применением па. 


кета Ехсе). у = Во + В1х1 т Вох2. 
х, = Ухи/п, = Зв = Хип. 
Уаа-) 0-Х 2)? $ 
-_ Уна - #2) — (хи — Я (хе - #2))* 
Зар-х)(и-ЮУ(ка — Са — х2) 
Хан - (ав - #2)? — Оха Я) — 2))* 
Хав- (и - Ха - #1)* 
Хе - (ар - 2) — Оихи — ео — 2) 
Уха - (и - (хи — #1) (2 — 2) 
хаа-я У (ь-2)? — Он - (о — #2) 


50 =У- 6151 — 6252. 


> 


Во всех формулах суммирование от 1 до п. 


Пример 26. Предполагается, что объем предложения 
товара у линейно зависит от цены товара х1 и зарплаты со- 
трудников хо: у = Во + В1х1 + Вох2. Статистические дан- 
ные собраны за 10 месяцев. Оценим по МНК коэффициен- 
ты уравнения регрессии. Заполняем таблицу. 


— 


(хи -— Е 
а-я 


(х2- х2)(у;— Г) 
—198 


х: = Ххи/п = 320/10 = 32, 
2 = ХУхр/п = 15/10 = 7,5, 
у = Хуип = 640/10 = 64. 
вы Хи - 21): - У У(хь — 2 
Хи - 1) Уж — 22)? — (Х(хн- 21) (хо — х2))? 
Ха - (и, - УУ(хи — х (хр — ь) 
Уха — (ар — (хи -— (кр — =.) 
е 3585 Х 64,5 — (—715)Х (-276) 
1778 Х 64,5 — (—-276)? 
С Хави -УУ(хи я? 
(хи — У (хр — 2)? — (Уха - 21) (12 — 2)? 
(ха — я (и: Х(хи — ях — #5) 
У(хи — #1) У (хр — #2)? — (Ф(хи — #1) — #2)? ' 
_ ©1715) х1778— 3585 (276) тар, 
1778 Х 64,5 — (-276)? 
в = УВ: х, —Бохо = 64—0,88Х 32-—(-7,32)ЖТ,5 = 90,74. 
у = 60 + &х, + 2х2 = 90,14 + 0,88»; — 7,32х›. 


= 0,88. 


|. 


Задача 26. Предполагается, что объем предложения 
товара у линейно зависит от цены товара х1 и зарплаты со- 
трудников хо:у = Во + В1х1 + Вох. еек данные 
собраны за 10 месяцев. Оценить по МНК коэффициенты 


Уравнения регрессии. 


$ 4.3. СТАНДАРТНЫЕ ОШИБКИ КОЭФФИЦИЕНТОВ 


Знание дисперсий и стандартных ошибок позволяет анали. 
зировать точность оценок, строить доверительные интерва. 
лы для теоретических коэффициентов, проверять гипоте. 
зы. Е 

Подставив значения факторов в найденное уравнение 
регрессии у = 60 + 1х1 +... + биыХи, получим числа 7, 
1=1,..., п. Тогда разность между наблюдаемым значени- 
ем у; и расчетным значением Й; есть величина ошибки 
ее 7ь = т, А: (9 


Стандартная ошибка регрессии $ = 
Зная 5, можно найти стандартные ошибки коэффици- 
ентов. Для случая т = 2 
58 = 52 ХР У (хе — 22) + 2 У(хи — Хх? 
У (ха — (хр — 5) — (У(хи — 1) (ха — 2) 
2х2 (хи — (хр — ©) 
Уха - Хо — 2)? — (Х(хи — (хр — 25) 
$8 - ХЕРНЕР т 
У(хи — Уз — Хо)? — (ФКхи — 2) — #2)? 
В о 
У(еи — р — о) Оха - из - 2)" 


Во всех формулах суммирование от 1 до п. 


1 
+ =). 


Пример 27. Найдем стандартную ошибку регрессии и 


стандартные ошибки коэффициент 
ов в прим Е ы 
няем таблицу. римере 26. Запол 


В последнем столбце рез 


м Ультат С 
запятой. ОКругляе 
после А м до двух цифр 


: = 2)" 
#2) >. Сан (хр - хо)? 
Е ы ия) 
хи - Ух, — 52)? — 
— 78,79 (32° Х 64,5 + 1.51118 — 2321,5 (276) 
1778 Х 64,5 — (-276} с 


251х. У 


1 
Си - ар рт 


1 
т = 618,76. Отсюда 5 = 24,87. 


Е. 9 = 82 Ух» - 

ео)? ь Уха — =) 22) — ( (хи — Я) 2-2) Е 
и. т. = 78,79 о = 0,1320. Отсюда 5ь, = 0,36. 

В 88: = 52 - ее = 
у . Уи - У (а 2.) (хи — #1 (ар — 2)? 
о СЕВ 


= 3,6381. Отсюда Вы 9Г. 
5) 38505 


Задача 27. Найти стандартную ошибку регрессии и 
стандартные ошибки коэффициентов в задаче 26. 


34.4. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ТЕОРЕТИЧЕСКОГО 
УРАВНЕНИЯ ЛИНЕЙНОЙ РЕГРЕССИИ 


Задается доверительная вероятность р. По найденным то- 
чечным оценкам 6, коэффициентов В», { = 0, 1, ..., т, мож- 
10 построить р-процентные доверительные интервалы. 
“= (1-р)/2. Из таблиц #-распределения находим 1.л-п-1. 
тотда р-процентный доверительный интервал а 
"а В задается формулой в попа ООВАЕ Е” 95 А ан 
ли 
ициентов теоретического уравнения и. 
3 примерах 26 и 27. Доверительная вер 


р= 0,95. «=(1-2)/2=@-0,95)/2 = 0,025. п-—10, п, 
Из таблиц #- распределения находим Фазп-т-1 = 10.02510-2 
= 2,365. ь 1 

50 те Е Х5ь = 90,74 Вх 2,365 х 24,87 < 90,74 + 98,82, 

ть 31,92 < Ву < 149,56. 
у ‚ а те. = 0,88 + 2,365 Х 0,36 = 0,88 + 0,85, 
0,03 < В! < 1,73. 
то т м Зь, = -1,32 + 2,365 Х 1,91 = -7,32 + 4,52, 
то есть —11,84 < В. < —2,80. 


Задача 28. Найти доверительные интервалы коэффи- 
циентов теоретического уравнения линейной регрессии в 
задачах 26 и 27. Доверительная вероятность 99%. 


- 8 4.5. ПРОВЕРКА СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ 
КОЭФФИЦИЕНТОВ УРАВНЕНИЯ ЛИНЕЙНОЙ 
РЕГРЕССИИ 


Мы включили в модель т объясняющих переменных 
Х1, ..., Хт. Возможно, что не все из них влияют на резуль- 
тативный признак у. Поэтому проводится проверка статис- 
тической значимости коэффициентов уравнения линейной 
регрессии. 


Но: В, = 0, то есть объясняющая переменная х; не влия- 
ет на результативный признак у. 
Нл: В; # 0, то есть объясняющая переменная х; влияет 
на результативный признак у. 
Доверительная вероятность р. а = (1 —Р)/2. Граничные 
точки +&,„_т_1. Статистика 5, = 6,/5ь 
,. 
Пример 29. Определим статистическую значимость ко- 
54 ноет Я Уравнения линейной регрес- 
римерах 26—28, Доверительная вероятность 95%. 
Но: В, = 0, то есть об 
: ъясняющая перем 
С н й х 
ет на результативный признак я 


На: В, # 0, то есть и 
Е объясняюща, 
хе я перем : 
на результативный признак у ая < элиЯ 


Проведем двусторон 
Е®л-т-1 = +2,365. О Граничные точки 
во — бо/Зь, = 90,74/24,87 = 3,649 
ы; = 81/Зь = 0,88/0,36 = 2,444’ 
вы; — 62/Зь, = —1,32/1,91 = — 3.839 
Отметим значения на числовой Е 


Мы отвергаем гипоте 
0, 

тя 5%. Вее Коэффициенты 

значимы, то есть х1 их, стати 


знак У. 


8 4.6. ПРОВЕРКА ОБЩЕГО КАЧЕСТВА УРАВНЕНИЯ 
ЛИНЕЙНОЙ РЕГРЕССИИ 


›менных 


‚ резуль- 
} статис- 
> ь а У е? 
инейной ры о 
Жи-9 
те влия- Коэффициент детерминации — это доля общего разбро- 
‘а значений результативного признака У, объясненная 
‚ влияет уравнением линейной регрессии. 0 < Е? < 1. Чем ближе 
к 1, тем лучше полученное уравнение линейной регрес- 
ничные ии объясняет поведение результативного признака у. 
величина В? не убывает с введением в модель дополнитель- 
ь ко- ного фактора. Исправленный коэффициент детерминации 
грес- Е —А*)(п-1) 
%. п-т-1 
е влия- введением в модель дополнительного фактора растет мед- 
еннее чем А? 
, М 5 
влияет целью анализа совокупной значимости позффиниол- 
"08 уравнения линейной регрессии ее стой 
точки "атистической значимости коэффициента детер 


го 82 = 0. 

: > 0. овер- 
ОВерительная вероятность р. р иаиы а 
Ка, = 1-р. Из таблиц Е-распределения наход 


ую точк 


у Ратл-т-1 : 
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5 4. 
3. 

ое г. 
Статистика 1 8? я блюде 
МО п ержап 


Пример 30. Вернемся к примерам 26 и 27. Найдем 
коэффициент детерминации и проверим гипотезу о его 
статистической значимости. Доверительная вероятность 


р= 95%. 
ты 


Коэффициент детерминации: 


2 
о Е - 0,038. 
2(- у’ 8940 
То есть наша модель объясняет 93,8% общего разброса 
значений результативного признака у. 
Исправленный коэффициент детерминации: 


(1-2)®-1 _._ @-0,938)(10-1) 


Е? =1- 1 = 0,920. 
п-т-1 20-21 

Но: В? = 0. 

Е В? > 0. 


Доверительная вероятность р = 0,95. Правосторонняя 
проверка. «а=1-р=1-— 0,95 = 0,05. 
Из таблиц Е-распределения находим граничную точку 
Ео;тлт-т-—1 = Е0,05;2;10-2—1 = 4,74. Статистика: 
т В? ВЯ ВВ 0,938 ВОО 
1—8? т 1-0,938 д 


52,9 


Мы отвергаем типотозу Но и принимаем гипотезу Н! на 
уровне значимости 5%. Предположение о незначительнос- 
ти связи отвергается. 


С о 30. В задачах 26 и 27 найти коэффициент де- 
рминации и проверить гипотезу о его статистической зна- 
чимости. Доверительная вероятность р = 99% 
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п 


$ 4.7. ПРОВЕРКА РАВЕНСТВА 

ДВУХ 
КОЭФФИЦИЕНТОВ ДЕТЕРМИНАЦИИ 
Поп наблюдениям пост 
сии, содержащее т фак 
ент детерминации В}2. 
Е объясняющих переме 


Роено уравнение линейной регрес- 


Торов. Для этой модели коэффици- 


После этого из модели исключили 


ных. Для нового уравнения линей- 
циент детерминации Е. Существен- 


тивного признака у? 


Но: ВР а В», 


то есть качество описания поведения ре- 
зультативного признака У ухудшилось существенно. 

я Доверительная вероятность р. Правосторонняя провер- 
ы ка. а =1—р. Из таблиц Е-распределения находим гранич- 
НУЮ точку: Рори. 

2 2 

Статистика Е = ре и. 
Е 


: Пример 31. Поп = 15 наблюдениям построено уравне- 
восторония ние линейной регрессии, содержащее т = = фактора. Для 

этой модели коэффициент детерминации В}? = 0,95. После 
этого из модели исключили Ё = 1 объясняющую перемен- 
ную. Для нового уравнения линейной регрессии коэффици- 
ент детерминации В? = 0,9. Существенно ли Ухудшилось 
качество описания‘ поведения результативного признака у? 
1 а 52,5. Доверительная вероятность р = 95%. 


‚чную точ 


Но: ВР = ЕР, то есть качество описания поведения ре- 
Зультативного признака у существенно не ухудшилось. 
Н1: В? > Е2, то есть качество описания поведения ре- 
Зультативного признака У ухудшилось существенно. 
Правосторонняя проверка. а = 1-р=1- 0,95 = 0,05. 
Из таблиц Е-распределения находим граничную точку 
Я о; п-т-1 = Е0,05;1;15-4-1 = 4,96. Статистика: 
Я р_ ВР-В? п-т-1 _0,95-0,9. 15-41 _ 
ия а 10,95 т 
и Отметим значения на числовой оси. 


10. 
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, маем гипоте 
Мы отвергаем гипотезу Но и приним ве ЗУ Н! на 
уровне значимости 5%. Качество описа дения ре. 


зультативного признака у ухудшилось существенно. 


Задача 31. По п = 12 наблюдениям построено Уравне- 
ние линейной регрессии, содержащее т = С фактора. Для 
этой модели коэффициент детерминации В1' = 0,90. После 
этого из модели исключили А = 2 объясняющих перемен- 
ных. Для нового уравнения линейной регрессии коэффици- 
ент детерминации В? = 0,84. Существенно ли ухудшилось 
качество описания поведения результативного признака у? 
Доверительная вероятность р = 99%. 


Замечание. Аналогичные рассуждения могут быть ис- 
пользованы для выяснения обоснованности включения в 
модель новых Ё объясняющих переменных. В этом случае 
Ну: В > В. 

ВВ пЕт1 

Статистика Ё = 2—1. х 


1-Е? Ё 


. 


$ 4.8. ПРОВЕРКА ГИПОТЕЗЫ О СОВПАДЕНИИ 
УРАВНЕНИЙ РЕГРЕССИИ ДЛЯ ДВУХ ВЫБОРОК. 
ТЕСТ ЧОУ 


Производится выборка объема п1. По ней строится уравне- 
ние регрессии у = 65; + б1ж +... + о и1хт + е1. Произво- 
дится выборка объема п2. По ней строится уравнение рег- 
рессии у = 602 + Вох +... + Втохт + е>. Будет ли уравне- 
ние регрессии одним и тем же для обеих выборок? 

Для каждой выборки находим сумму квадратов остатков 

п 
эт = Хе и $52 = Хе, соответственно. По объединенной 
= 1=1 
выборке объема п1+п2 строим уравнение регрессии, для ко- 
торого также находим сумму квадратов остатков бо = Хе 
= 

о: В Вы Ор ои возвоть коэффициенты урав- 
нений линейной регрессии одинаковы. 

Нл: коэффициенты уравнений линейной регрессии раз- 
личны. 

Доверительная вероятность р. Правосторонняя провер- 
ка, и=1-р. Из таблиц Е-распределения находим гранич- 
ную точку Е ©т-+-1;п1-+пэ-2т-2. 

в. —2т-—2 

Статистика Р = 0-51-82 „иа+т:- 2т-2. 

51+ 52 т+1 


Пример 32. Поп = 


ор 25 наблюдениям построено уравне- 
ние линейной регрессии 


г ‚› содержащее т = 2 фактора. Есть 
ео в, основания предполагать, что модель будет более реалистич- 
ра, А, ной, если весь интервал наблюдений разбить на два подын- 
›90. о, тервала и оценивать уравнение линейной регрессии для 
х Перец, каждого из них отдельно. Это связано с изменением инсти- 
о туциональных условий между 10-м и 11-м наблюдениями. 
Уд Ь Суммы квадратов остатков для общей выборки 5у = 140, 
Иа для 1-го подынтервала 51 = 100, для 2-го подынтервала 
И 5. = 30. Есть ли основания считать, что это разбиение це- 
лесообразно? Доверительная вероятность р= 95%. 
тут быть п, Но: би = 62,1=0,1,..., т, то есть коэффициенты урав- 
ЗКЛЮЧения } нений линейной регрессии одинаковы. 
ЭТОМ слу Н:: коэффициенты уравнений линейной регрессии раз- 


личны. 

Доверительная вероятность р = 0,95. Правосторонняя 
проверка. «=1-р=1—0,95=0,05. п1 =10, п›=25-—10=15. 
Из таблиц Е-распределения находим граничную точку 
Разт+1;п1+п2-2т-2 = Е0,05;2+1;10+15-2%2-2 = 3,13. 


СЕ +п — Эт- 
Статистика Ё = сек: х а: ЖЕ 


51 +52 т-+1 
_ 140-100-30 „10415222 оо 
100+30 2+1 


Мы принимаем гипотезу Но на уровне значимости 5%. 
Для всего рассматриваемого периода нужно строить еди- 
ное уравнение регрессии. 


Задача 32. По п = 24 наблюдениям построено уравне- 
ние линейной регрессии, содержащее т = 2 фактора. Есть 
основания предполагать, что модель будет более реалистич- 
ной, если весь интервал наблюдений разбить на два подын- 
тервала и оценивать уравнение линейной регрессии для 
каждого из них отдельно. Это связано с изменением инсти- 
туциональных условий между 12-м и 13-м наблюдениями. 
Суммы квадратов остатков для общей выборки 5% = 120, 
для 1-го подынтервала 51 = 80, для 2-го подынтервала 
52 = 25. Есть ли основания считать, что это разбиение це- 
лесообразно? Доверительная вероятность р — 99%. 


5 4.9. РЕГРЕССИЯ И Ехсе! 


Ехсе] позволяет при построении уравнения линейной рег- 
Рессии большую часть работы сделать очень быстро. Важ- 
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ные резуль 

но понять, как я а к Результаты, 
Воспользуемся надстройкой ыы ОЕ. ма 

Сервис > а нужно заполнить, В трй: 
Вась у: указывается ссылка ыы со- 
держащие значения результативного признака у. 2 графе 
Входной интервал Х: указывается ссылка я со- 
держащие значения факторов х1, ..., хи (т < 16). Ровень 
надежности (доверительная вероятность) по умолчанию 
предполагается равным 95%. Если исследователя это зна. 
чение не устраивает, то рядом со словами Уровень надеж. 
ности нужно поставить «галочку» и указать требуемое зна. 
чение. Поставив «галочку» рядом со словом константа- 
Ноль, исследователь получит 60 = 0 по умолчанию. Если 
нужны значения остатков р и их график, то нужно поста- 


ВЫВОД ИТОГОВ 
Регрессионная статистика 
Множественный В В 
В-квадрат Е? 
Нормированный В-квадрат В? 
Стандартная ошибка 5 
Наблюдения 
ее ЕЕ 


п 


Дисперсионный анализ 


а 55 М5 Е Значимость Е 
Регрессия шт 50:-1)? $3/а Статистика Е— Ерасп (Е; 


= М5(регр)/ ЧЁ(регр); 

МБ(ост) ЧЁ(ост)) 
Остаток  п-ш— 5(и:-9,)? 55/4 
Ито ^^ 90" 58/4 


Итого п-1 Сумма 


ВЫВОД ОСТАТКА 


Наблюдение п 


редсказанный Остатки 


вить «галочки» рядом со словами Остатки и График ос- 
татков. ОК. Появляется итоговое окно. 

Если число в графе Значимость Е превышает 1 — Уро- 
вень надежности, то принимается гипотеза Е? = 0. Иначе 
принимается гипотеза В? +2 0. 

Р-значение — это значения уровней значимости, соответ- 
ствующие вычисленным {-статистикам. Р-значение = 
= СТЬЮДРАСИ (+-статистика; п— т- 1) (статистическая 
функция мастера функций {,). Если Р-значение превышает 
1 — Уровень надежности, то соответствующая переменная 
статистически незначима и ее можно исключить из модели. 

Нижние 95% и Верхние 95% — это нижние и верхние 
границы 95-процентных доверительных интервалов для ко- 
эффициентов теоретического уравнения линейной регрес- 
сии. Если исследователь согласился с принятым по умол- 
чанию значением доверительной вероятности 95%, то по- 
следние два столбца будут дублировать два предыдущих 
столбца. Если исследователь вводил свое значение довери- 
тельной вероятности р, то последние два столбца содержат 
значения соответственно нижней и верхней границы 
р-процентных доверительных интервалов. 

Если же надстройки Пакет анализа нет, то можно вос- 
пользоваться статистической функцией ЛИНЕЙН мастера 
функций #,. Перед вызовом это функции нужно выделить 
диапазон ячеек следующего размера (для парной регрес- 
сии это блок размера 5Х2). ` 


[Статистика Е | п-ш-1 | 
[50:9 [34 


Тогда после выполнения процедуры в ячейках будут на- 


ходиться указанные величины. ]х —> статистические > 
ЛИНЕЙН -+ ОК. Появляется диалоговое окно, которое 
нужно заполнить. Если исследователю требуется 6% = 0, то 
в графе константа нужно ввести значение 0. В графе ста- 
тистика указывается значение 1. После этого нажимает- 
ся не ОК, а комбинация клавиш сы + 5Ё + Ещег. 


55 


Глава 5 
—_дджжжжжжаАаА/„—”«”«”«С”Жж«ж— 


ГЕТЕРОСКЕДАСТИЧНОСТЬ 


При использовании МНК и в парной, и во множественной 
линейных регрессиях были наложены некоторые ограни- 
чения. Ближайшие три главы будут посвящены изучению 
выполнимости предпосылок МНК. 

Одной из предпосылок МНК является условие постоян. 
ства дисперсий случайных отклонений (гомоскедастич- 
ность). Не должно быть априорной причины, вызываю- 
щей большую ошибку (отклонение) при одних наблюдени- 
ях и меньшую — при других. Невыполнимость данной 
предпосылки называется гетероскедастичностью. 

На практике гетероскедастичность не так уж и редка. 
Проблема гетероскедастичности характерна для перекрест- 
ных данных и довольно редко встречается при рассмотре- 
нии временных рядов. Оценки, полученные по МНК, при 
наличии гетероскедастичности не будут эффективными (то 


ь, будут занижены. Поэтому ста- 
тистики &,, = 6/Зь будут завышены, что может привести к 


признанию статистически значимыми коэффициентов, ко- 
торые таковыми не 


6, а Та; п-т-1 5ь, 
линейной регре 


деления гетероскедастичности. 


личиваться, либо умень 
п — число наблюдений. 
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жируются (упорядочиваютс 
рез 4 разность между 


я по величине). Обозначим че- 
рангами значений переменной х и |е/.. 


Коэффициент ранговой 
ф корреляции г.., 


=1-—6 5 
п(п”-1) 
Зададим доверительную вероятность р. «=(1-—р)/2. По 
|-таблицам находим граничную точку &._о. 


Ре п 
Статистика # = а 


ИЕ 
1 те 


Если # < &.„_о, то на уровне значимости © принимается 


гипотеза об отсутствии гетероскедастичности. Иначе гино- 
теза об отсутствии гетероскедастичности отклоняется. В 
модели, содержащей несколько факторов, проверка гипо- 
тезы об отсутствии гетероскедастичности проводится с по- 
мощью статистики { для каждого из них отдельно. 


Пример 33. В примерах 18 и 19 проверим гипотезу об 
отсутствии гетероскедастичности с помощью теста ранго- 
вой корреляции Спирмена. Доверительная вероятность 


Заполним таблицу. Модули элементов второго столбца 
запишем в 3-й столбец. В 4-м и 5-м столбцах ранжирова- 
ны по убыванию элементы 1-го и 3-го столбцов соответст- 
венно. п = 5 наблюдений. 

2 16 
6 > _ аб 
п(п?— 1) 5(5°—1) 
а=(1-=р)/2=(1= 0,95)/2 = 0,025. По #-таблицам нахо- 
дим граничную точку ю:л-2 = #0,025;5-2 = 3,182. 


„„.Мт-2 _ 0,2 {5-2 = 0,354 < 3,182. 


с сир 
татистика # “=. \1-0,2° 


Мы принимаем гипотезу об отсутствии гетероскедастич- 
0 
ности на уровне значимости 5%. 


‚2. 


В задачах 18 и 19 проверить гипотезу об от. 
скедастичности с помощью теста ранговой 
я вероятность р = 99%. 


Задача 33. 
сутствии гетеро 
корреляции Спирмена. Доверительна: 


Замечание. При ранжировании значений переменной 


можно воспользоваться надстройкой Пакет анализа в 
Ехсе!. Сервис -> Анализ данных -> Ранг и персентиль 
ОК. Появляется диалоговое окно, которое нужно запол- 
нить. Выбирается способ группирования данных (по стро- 
кам или по столбцам). ОК. Данные упорядочиваются по 
убыванию. 

При отсутствии надстройки Пакет анализа можно вос- 
пользоваться статистической функцией РАНГ (число; ссыл- 
ка; порядок) мастера функций {, пакета Ехсе!. Здесь число 
— это значение переменной, для которого определяется 
ранг в наборе данных. Ссылка — это ссылка на ячейки, ко- 
торые содержат значения переменной. Если порядок = 0 
или опущен, то определяется ранг значения переменной для 
данных, упорядоченных по убыванию. Если порядок = 1, 
то определяется ранг значения переменной для данных, 
упорядоченных по возрастанию. 


8 5.2. ТЕСТ ГОЛДФЕЛДА-КВАНДТА 


Рассматривается связь величин вида у = а + 6х. Предпола- 
гается, что стандартное отклонение о; = ©(&;) пропорцио- 
нально значению переменной х в этом наблюдении: 
0% = со'х,1=1,..., п, п — число наблюдений. Также пред- 
полагается, что &; имеет нормальное распределение и от- 
сутствует автокорреляция (будет рассмотрена в дальней- 
шем). Все п наблюдений упорядочиваются по величине х. 
Эта упорядоченная выборка делится на три примерно рав- 
ные части объемов Ё, п-—2Ё и Ё соответственно. При 
п = 30 Ё = 11, при п = 60 = 22. 
Для каждой из выборок объема Ё оценивается свое урав- 
нение регрессии и нах. й 
рег ы одятся суммы квадратов отклонений 
ЕЕ 2 2 2 
5: = Хе? и 53 = Хе? соответственно. 
1=1 1=п- +1 
Зададим доверитель 
н 
в р ую вероятность р. а=1-р. По 
аблицам находим граничную точку Е где 
т — число факторов модели. Статистика 5" г 
Если Е < а ео то на уровне Е: 
нимается гипотеза об отсутствии г о ааеаие 
етероскедастичности. 
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Иначе ее 00 отсутетвии гетероскедастичности откло- 
няется. Для множественной регрес 

р сии тест обычно прово- 

дится для ры фактора, который в максимальной степени 

связан с ©:. !ри этом выбирают Ё > т +1. Если нет 

ренности относительно выбора фактора х, 

, 

можно осуществить для каждого фактора, 


уве- 
то данный тест 


ва : Пример о Рассматривается регрессионная линейная 
Заютея " модель с 1? = 2 факторами. п = 30 наблюдений. Для пер: 


ь вых и последних Е = 11 наблюдений суммы квадратов от- 
ОЖно 80% клонений 51 = 20 и $; = 45 соответственно. С помощью те- 

о; с р ста Голдфелда-Квандта проверим гипотезу об отсутствии 

> Ыл. гетероскедастичности. 

есь Число 
еделяетет Зададим доверительную вероятность р = 95%. 
тЧейки, ко. а=1-р=1- 0,95 = 0,05. По Р-таблицам находим гра- 
орядок = 1 ничную точку Ро;л-пт-1:-т-1 = Р0,05;11-2-1;11-2-1 = 3,44. 
НЙ Статистика Ё = 63/5: = 45/20 = 2,25 < 3,44. На уровне 
= значимости 5% принимается гипотеза об отсутствии гете- 
р ) роскедастичности. 
тя данных, 


Задача 34. Рассматривается регрессионная линейная 
модель с т = 2 факторами. п = 30 наблюдений. Для пер- 
. вых и последних Ё'= 11 наблюдений суммы квадратов от- 
клонений 51 = 18 и 5з = 52 соответственно. С помощью те- 

ГА ста Голдфелда-Квандта проверить гипотезу об отсутствии 
гетероскедастичности. Доверительная вероятность р = 99%. 


‚, Предтоле 
пропории” 
блюдейи"" $ 5.3. СМЯГЧЕНИЕ ПРОБЛЕМЫ 
ахже пре’ ГЕТЕРОСКЕДАСТИЧНОСТИ. МЕТОД ВЗВЕШЕННЫХ 
- ение #0. НАИМЕНЬШИХ КВАДРАТОВ (ВНК) 
ле” ей 
А В р #. После установления гетероскедастичности модель преобра- 
велит 088 зуют с целью устранения этого недостатка. Вид преобразо- 
имерй п вания зависит от того, известны или нет дисперсии о; от- 
вен?" клонений &,#=1, ..., П. Используют метод ВНК. Ограни- 
г у , чимся случаем, когда у = Во + Вх +=, дисперсии о; неизве- 
ь стны альны Хх}. 
680 5 и пропорцион г 
мкл" у = Во + Вужр + =: = ун/ ху = Во/ и + Ву + = 
во = у/х, = Во/х! + Ва + 9ь где 1 = ВИ 
Для этого уравнения уже выполняется условие гомоске- 
й оценки коэффициентов Во, 
ей дастичности. По МНК находим 
ори авнению. В случае, ког- 
21 Й 1 и возвращаемся к исходному УР а 
0 пе Да число факторов т > 1, исходное уравнение д 


Е д’ переменную, которая в максимальной степени связана с 0;. 
° 
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я предприятий отрасли анализируется 
мости от х (количество сотрудников). 
ятий. 


Пример 35. Дл 


си 
зарплата у в зави 
п = 30 случайно отобранных предпри 


785 | 80 | 81 
85 85,5 | 86,5 


91 95 96 
99 102,5 | 105 


110,5 | 115 [| 118,5 


Уравнение линейной регрессии у = Во +В1х-+:. Так как 
с ростом х разброс значений у увеличивается, то можно 
ожидать наличие гетероскедастичности. Предположим, что 
гетероскедастичность имеет место и о" пропорциональны 
х'. Введем новые обозначения 2 = у/х и Ё = 1/х и перей- 
дем к уравнению 2 = Воё + В1. По МНК находим оценки ко- 
эффициентов Во, В1 и возвращаемся к исходному уравне- 
нию у= Во + В1х. 

Задача 35. В примере 35 с помощью теста Голдфелда- 
Квандта проверить гипотезу об отсутствии гетероскедастич- 
ности (Ё = 12). Доверительная вероятность р = 95%. Уст- 
ранить гетероскедастичность и найти оценки коэффициен- 
тов Во, В1. Рекомендуется воспользоваться пакетом Ехсе|. 


дфелда- 
дастич- 
%. Уст: 
рициен- 
Ехсе|, 


Глава 6 


ее 5е ОВЕН, 
АВТОКОРРЕЛЯЦИЯ 


Одна из предпосылок МНК — это независимость значений 


ды) или в пространстве (перекрестные ряды). Автокорре- 
ляция остатков (отклонений) обычно встречается при ис- 
пользовании данных временных рядов. Последствия авто- 
корреляции в определенной степени сходны с последствия- 
ми гетероскедастичности. 

Нам неизвестны истинные значения отклонений $5,, 
1=1,..., п. Поэтому выводы об их независимости делают- 
ся на основе оценок е,, #=1,..., п. При этом обычно про- 
веряется их некоррелированность, являющаяся необходи- 
мым, но недостаточным условием независимости. Прове- 
ряется некоррелированность только соседних величин е;. 
При наличии автокорреляции остатков полученное уравне- 
ние регрессии считается неудовлетворительным. 

Рассмотрим возможные методы определения автокорре- 
ляции и способы ее устранения. 


$ 6.1. МЕТОД РЯДОВ 


Определяются знаки отклонений е;. Ряд — а Е 
ная последовательность одинаковых боль 
— это количество знаков в ряду. п — Чи : 


— общее количество 
8 аков «+», П2 
11 — общее количество зн Доверительная вероят- 


1-р=1-0,95=0,05. 
блюдений (п! < 20, по < г из 

С ‚ Пи а = 0,05 
‘пециальных таблиц ЕР у у {= ла. 
находят числа #1 и №2. Если т говорят о положительной 


Ция отсутствует. Если # < и в > Е», то говорят об от- 
Чвтокорреляции остатков: Е 


знаков «—», Ё — количество не Бава 
ность р = 0,95, уровень значимости 


Для небольшого числа на 


РИ 


рицательной автокорреляции остатков (за ложитель. 
ным отклонением следует отрицательное и наоборот). 


Пример 36. Вернемся к примеру 27. Определим нали- 
чие автокорреляции методом рядов. 


т. 


Последовательность знаков указана во второй строке. У 
нас п: = 5 (5 плюсов), п2 = (5 минусов), Ё = 5 (5 рядов). 
Из специальных таблиц Сведа-Эйзенхарта по п1, пои 
© = 0,05 находим числа А; =2 и #, = 10. Так как 1 <Ё < 
(2 < 5 < 10), то автокорреляция отсутствует. 

Задача 36. п, = 12, пр=8, Е =3, #1 = бир. = 16. 

Определить наличие автокорреляции методом рядов. 


3 6.2. КРИТЕРИЙ ДАРБИНА-УОТСОНА 


Это наиболее известный способ обнаружения автокорреля- 
ции первого порядка. Пусть п. — число наблюдений, т — 
число факторов модели, уровень значимости © = 0,05. Для 


п, т, а по таблицам распределения Дарбина-Уотсона нахо- 
дим числа 4} и 4. 


(Е — е,-1 


Статистика Дарбина-Уотсона РИ’ — {=2 


Если ДУ < 4, то это свидетельствует о положительной 
автокорреляции остатков. Если ДИ > 4— 4, то это свиде- 


ПВ #0; 


4) среди факторов не должно быт 


то есть переменных, влияние кот 
определенным запаздыванием). 


ь лаговых переменных 
орых характеризуется 


Пример 37. Вернемся к примеру 27. Определим нали 
автокорреля у Е 
чие : рреляции с помощью критерия Дарбина-У 


отсо- 
на. Хе’ = 551,52. 
21 
ы 
8,3 
4,26 | —4,04 | 16,32 
к 279,56 
1 
БЕ. 
Г 9 | 8,34[ 10,6 | 112,36 
орел [ Сумма | | 988,98 
и Заполняем таблицу. Из каждого числа 2-го столбца вы- 
05. Дн читаем предыдущее число 2-го столбца и результат пишем 
8 НаХО- в 3-м столбце. В 4-м столбце числа округляем до двух зна- 
ков после запятой. Статистика Дарбина-Уотсона: 
2 
У(е-е_ 1)? 
: Й а! 
р Е я = 1,193. 
йе Уе? ‚ 
1 
ьНой По таблице распределения Дарбина-Уотсона находим 
сз 4; = 0,697 и а, = 1,641. Тогда 4 — 4, = 4 - 1,641 = 2,359. 
и 0 Так как 4, < РИ < 4 - а, (1,641 < 1,793 < 2,359), то 
тк . гипотеза об отсутствии автокорреляции остатков не откло- 
| ди няется на уровне значимости 0,05. Это является одним из 
, ий подтверждений высокого качества модели. 
ри Задача 37. В задаче 27 определить наличие автокорре- 


ляции с помощью критерия Дарбина-Уотсона. Уровень зна- 


чимости 0,05. 


$ 6.3. МЕТОДЫ УСТРАНЕНИЯ АВТОКОРРЕЛЯЦИИ 


одели 
Возможно, автокорреляция вызвана аа д = 
важной объясняющей переменной. Нужно по 
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и 
ств 07 
ть данный фактор и включить его в модель. Также ие ы ни 
к ависимости. Н ИЯ” ОГО 1 
можно попробовать изменить форму з д - НО если ВЯ ерво к 
все разумные процедуры изменения спецификации Модели 58 51,3 
исчерпаны, а автокорреляция имеет место, то можно Вос. р 1—1 
пользоваться авторегрессионным преобразованием. 22 
Для простоты ограничимся моделью парной линейной ре- ы. в -# 
грессии и авторегрессионной схемой первого порядка АК\(1 ). Я няем т 
У = Во + В1х + =. Вместо переменных у, х рассмотрим пе. залол преды 
еменные у*, х*, значения которых вычисляются по пра- р та 
р у , ЮО 2 А. зуль 
вилу у^=и рут, жа рхь1=2, ..., п, р=1 Ра, ми о запя 
Поправки Прайса-Винстена: "но ПОСЛ > 


= Во(1 —р). Тогда по таблице значений пе- 
ременных у*, х* оцениваются коэффициенты Уравнения 
У" = Во* + В1х*. Затем получаем Во = Во*/(1 — р). 


Пример 38. Оцениваются коэффициенты уравнения 
У -а+ 6х, где значения переменных х, у — первые два 


столбца таблицы. 


х1*= х1 1 -р?, у = и \1- р". "ТМК а 
ее 2 з 


— 
НИ 


. 
- 


ы 
и 


| 


й 


, 
ы 


- 


0,89 
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Глава 7 
потери ии тат 


МУЛЬТИКОЛЛИНЕАРНОСТЬ 


Мультиколлинеарность — это линейная взаимосвязь двух 
или нескольких объясняющих переменных. Каковы по- 
следствия мультиколлинеарности? 

1) Большие стандартные ошибки 5ь, что расширяет до- 
верительные интервалы теоретических коэффициентов 
уравнения линейной регрессии. 

2) Уменьшаются статистики 5 = /5ь, поэтому возмо- 
жен вывод о статистической незначимости коэффициента В,. 

3) Ши Зь становятся очень чувствительными к малей- 
шим изменениям данных. 

4) Затрудняется определение вклада каждой из объяс- 
няющих переменных в объясняемую уравнением линейной 
регрессии дисперсию результативного признака. 


5) Возможно получение неверного знака у коэффициен- 
тов регрессии. 


$ 7.1. УСТАНОВЛЕНИЕ МУЛЬТИКОЛЛИНЕАРНОСТИ 


Высокий коэффициент детерминации и низкие статистики 
*, некоторых переменных свидетельствуют о наличии 
мультиколлинеарности. Также о наличии мультиколлине- 


менных). 
Например, при трех факторах Х1, Х2, Хз частный коэф- 
фициент корреляции Между х1 их» равен: 


(712—713 Х оз) 


12.8 — Е 
` У(1 — 2.3) (1 —7Ъ3) 


Аналогично ВЫЧИСЛЯЮТСЯ Г13.2 и Гоз 1. 
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связь 
ДВ 
Каковы цу 


с ширяет Ц. 
ффициентоз 


Этому 8030. 


фициента |}, 
тМИ К Мале: 


ой из 005" 
ем линейно! 


щи 39. В модели три фактора х1, хо, хз. Коэффи- 
иене орреляции 4. = 0:44. г1з = —0,35, гоз = 0,51. Най- 
дем частный коэффициент корреляции между х1 их, 


> (712—718 Хто) —  0,44-(-0,35) 0,51 


12.3 Е - 
\а-Зэа-) Уа-созэза-о55 
= 0,768. 


Задача 39. В модели три фактора х1, хо, хз. Коэффи- 
циенты корреляции г. = 0,42, г; = —0,36, Гоз = 0,53. Най- 
ти частный коэффициент корреляции между х1 и хо. 


Замечание. Ехсе! позволяет вычислить корреляционную 
матрицу (матрицу из попарных коэффициентов корреляции) 
1 
Г12 И 
т Гт-1,т 1 
для любого количества переменных. 
Сервис -—> Анализ данных -> Корреляция -> ОК. Появ- 
ляется диалоговое окно, которое нужно заполнить. Рядом 


со словом Группирование нужно указать, как расположе- 
ны исходные данные (по строкам или по столбцам). ОК. 


$ 7.2. МЕТОДЫ УСТРАНЕНИЯ 
МУЛЬТИКОЛЛИНЕАРНОСТИ 


Иногда мультиколлинеарность не является таким уж серь- 
езным «злом», чтобы прилагать существенные усилия по 
ее выявлению и устранению. Все зависит от целей иссле- 
дования. Если основная задача модели — прогноз будущих 
значений результативного признака, то при В* > 0,9 нали- 
чие мультиколлинеарности обычно не сказывается на про- 
гнозных качествах модели. Единого метода устранения 
мультиколлинеарности не существует. Простейшим мето- 
дом устранения мультиколлинеарности является исключе- 
ние из модели ряда коррелированных переменных. В при- 
кладных моделях лучше не сокращать число факторов до 
тех пор, пока мультиколлинеарность не станет серьезной 
проблемой. Иногда для уменьшения мультиколлинеарнос- 
Ти достаточно увеличить объем выборки. Но при этом мо- 
Жет усилиться автокорреляция. Иногда проблема мульти- 
Коллинеарности может быть решена путем изменения спе- 


Чификации модели. 
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Глава 8 


ФИКТИВНЫЕ ПЕРЕМЕННЫЕ 


Очень часто в регрессионных моделях в качестве объясня- 
ющих переменных используют не только количественные 
(определяются численно), но и качественные. Обычно в мо- 
делях влияние качественного фактора выражается в виде 
фиктивной переменной, которая отражает два противопо- 
ложных состояния качественного фактора. Например, 


а 0, если сотрудник не имеет высшего образования, 
— 1, если сотрудник имеет высшее образование. 


Модели, в которых объясняющие переменные носят как 
количественный, так и качественный характер, называют- 
ся АМСОУА-моделями (моделями ковариационного анали- 
за). Если качественная переменная имеет Ё альтернатив- 
ных значений, то при моделировании используют только 
& —1 фиктивную переменную. Значения фиктивной пере- 
менной можно менять на противоположные. Суть модели 
от этого не изменится. 


Пример 40. Исследуется надежность станков трех про- 
изводителей а, 6, с. При этом учитывается возраст станка 
М (в месяцах) и время Н (в часах) безаварийной работы до 
последней поломки. Выборка из 40 станков дала следую- 
щие результаты. 


>|-=|-ыы| 


-ы 
> 
> 
— 
[2 
-- 
>22енееюен ее 


&©|=|ы|ю 


— 


У уравнения регрессии Н = Во + В.М += без учета разли- 
чия станков различных фирм невысокий коэффициент де- 
терминации В? = 0,686. Поэтому нужно учитывать произ- 
водителя станков. Качественная переменная «Производи- 
тель станков» может принимать Ё = 3 значения р: 6): 
Поэтому нужно ввести в модель -1=3— 1=2 фиктивных 
переменных Ри В. 


Е- { 0, если производитель а, 
1, если производитель 6 или с. 


В- т если производитель а или Б, 
1, если производитель с. 


Для производителя а Е = В = 0, для производителя Ь 
ЗЕЕ 0, для производителя с Е = В = 1. 

Теперь нужно оценить коэффициенты уравнения 
Н=Во+В1М + у. Е +у2В (см. результаты главы 4). 


Задача 40. В примере 40 оценить коэффициенты урав- 
нения Н=Во+В1М+у1Е +728. 


Пусть рассматривается уравнение у = Во + В1х и в мо- 
дель решено ввести фиктивную переменную р. 

Это можно сделать двумя способами: у = Во-+ В1х+у1Р и 
У Во+ В1х + у, + 2х. 

ты _ и 2 называются дифференциальным 
<вободным членом и дифференциальным угловым коэффи- 
Чиентом соответственно. 

Фиктивная переменная Д во втором уравнении исполь- 
ЗУется как в аддитивном (\10), так и в мультипликатив- 
НОМ виде (у20х), что позволяет фактически разбивать рас- 
‘матриваемую зависимость на две части; связанные с пери- 

ами изменения рассматриваемой в модели переменной. 
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Пример 41. Исследуется эффективность лекарств у в 
зависимости от х (возраст пациента). При этом сравнивает- 
ся эффективность лекарств а и 6. 


Лек-во 


Вводится фиктивная переменная Л: 


р= | если лекарство а, 


1, если лекарство 6. 


Возможен один из трех вариантов: у = Ву + Вх, 
у—Во+ Вх +71 или у= Во + Вх +7. 2+ х. 


Задача 41. Какой из вариантов, по вашему мнению, 
предпочтительнее? 


Глава 9 


НЕЛИНЕЙНЫЕ СВЯЗИ 


Многие экономические зависимости не являются линейны- 
ми по своей сути, и поэтому их моделирование линейными 
уравнениями регрессии не приведет к положительному ре- 
зультату. Мы ограничимся нелинейными моделями, допу- 
скающими сведение к линейным моделям. Это линейные 
относительно параметров модели. 


Пример 42. Дана зависимость у = Ах8, где Аи В — 
константы, подлежащие определению. 


Тогда шу = ш(Алх8) = ША + шх8 = ША + Вых. 
Положим 2 = Шу, Во = ША, # = шх. Тогда 2 = Ву + В+. 
Это линейное уравнение. Мы можем оценить коэффициен- 
ты Во, В, а затем найти оценку для А = е№. 
Пример 43. Дана зависимость у = АКЗГВ, где А, аи В 
— константы, подлежащие определению. 
Тогда шу = ш(АК“Г^) = шА + атК + В. 
Положим 2 = Ши, Во = ША, х! = шК, хо = шГ. Тогда 
2 = Во + ах! + Вх2. Это линейная модель. Мы можем оце- 
нить коэффициенты Во, @, В, а затем найти оценку для 
А = ев. 
Задача 42. шу = Во + В1х. Свести к линейной модели. 


Задача 43. у = Во + Вишх. Свести к линейной модели. 


2 
Пример 44. у = Во + В1х + 2. 
Положим х, = х, ха = 52. Получилась модель множест- 
Е а + Вэх2. 
зенной линейной регрессии у = Во + Вл: Вах 


Задача 44. у = Во + В1Х 1/х. Свести к линейной моде- 


ли. о 
Пример 45. Дана зависимость У ры ева 0 
Виу — константы, подлежащие определению. 
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Тогда пу = ш(АК“Т^е") = шА + от К + ВшГ + у. 

Положим 2 = Шу, Во = ША, х1 = ШК, х1 = ШГ. 

Тогда г = Во + ах! + Вхо + \Ё. Это линейная модель. 

Мы можем оценить коэффициенты Ву, а, В, у, а затем 
найти оценку для А = е№. 


Задача 45. у = Все". Свести к линейной модели. 


Глава 10 


ПОРЯДКОВЫЕ ИСПЫТАНИЯ 


наковой длины п > 10. Нас интересует, есть ли между ними 
связь. Задается доверительная вероятность р. а = 1 — р. 

Но: между двумя последовательностями нет связи, они 
не согласованы друг с другом. 

Ни: между двумя последовательностями существует не- 
кая связь. 

По а находим граничную точку 2. > 0. Для последова- 
тельностей вычисляем ранговый коэффициент корреляции 


Спирмена г.. Статистика 2 = та \п-1. 


Пример 46. Два человека дегустируют 10 сортов чая. 
Каждый из них расположил эти сорта в порядке убывания 
предпочтений (второй и третий столбцы). Есть ли какая- 
нибудь связь между этими результатами? Доверительная 
вероятность р = 95%. 


Сорт чая | Дегустатор 1 | Дегустатор 2 


а это разность между значениями дегустаторов для 
°АНого и того же сорта чая. 
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Но: между результатами этих исследований нет связи, 
они не согласованы друг с другом. ь 
Н\1: между результатами исследовании существует не- 
кая связь. 
р= 0,95, а=1-р=1- 0,95 = 0,05 => 2. = 20,05 = 15645. 
Ранговый коэффициент корреляции Спирмена: 
54? 38 


Я = 0,17 
п(п? — 1) 10(10*—1) 
Статистика 2 = г. \ п-1= 0,77\ 10 —- 1=2,31 > 1,645. 
Мы отвергаем гипотезу Но и принимаем гипотезу Н1 на 


уровне значимости 5%. Между результатами исследований 
существует некая связь. 


Г; 


Задача 46. Два человека дегустируют 10 сортов чая. 
Каждый из них расположил эти сорта в порядке убывания 
предпочтений (второй и третий столбцы). Есть ли какая- 
нибудь связь между этими результатами? Доверительная 
вероятность р = 99%. 


Дегустатор 1 | Дегустатор 2 
А 1 2 


"ТЬ ЛИ Кака, 
Верите 


Глава 11 
=: АЕ... 


ВРЕМЕННЫЕ РЯДЫ 


В этой главе мы рассмотрим возможность использования 
данных за прошлые периоды для прогнозирования. 

Множество данных, где время является независимой пе- 
ременной, называется временным рядом. Будут рассмотре- 
ны аддитивные и мультипликативные модели. 

Общее изменение со временем значений результативно- 
го признака называется трендом. Мы рассмотрим модели 
линейного тренда, то есть параметры тренда можно рас- 
считать с помощью модели линейной регрессии. 

Сезонная вариация — это повторение данных через не- 
большой промежуток времени. Под «сезоном» можно по- 
нимать и день, и неделю, и месяц, и квартал. Если же про- 
межуток времени будет длительным, то это — цикличес- 
кая вариация. Мы остановимся на изучении данных для 
небольших интервалов времени, поэтому циклическую ва- 
риацию исключим из рассмотрения. 

Сначала на основании прошлых данных определяется 
сезонная вариация. Исключив сезонную вариацию (прове- 
дя так называемую десезонализацию данных), с помощью 
модели линейной регрессии находим уравнение тренда. По 
уравнению тренда и прошлым данным вычисляем величи- 
ны ошибок. Это среднее абсолютное отклонение МАР = 
= У!/п и среднеквадратическая ошибка МЗЕ = Уе?/п, 
где е; — это разность фактического и прогнозного значе- 


ний в момент времени #, п — число наблюдений. 


$ 11.1. АНАЛИЗ АДДИТИВНОЙ МОДЕЛИ 


ическое значение А = трендо- 


Для а Е ели факт 
ддитивной мод ф 5 +. ошибка Е. 


В0е значение Т + сезонная вариация 
В таблице указан объем продаж (тыс. руб.) 


алов. Дадим на основании этих дан- 
два квартала. 


Пример 47. 
за последние 11 кварт 
ных прогноз объема продаж на следующие 


Квартал 


Объем продаж 


На первом шаге нужно исключить влияние сезонной ва. 
риации. Воспользуемся методом скользящей средней. За. 
полним таблицу. 


Скользящая Центрированная Оценка 
средняя за скользящая сезонной 
4 квартала вариации 


Номер Объем 
квартала продаж 


= 4 квартала. Поэтому найдем среднее значение 
объема продаж за 4 последовательных квартала. Г 
Для этого нужно сложить 4 последовательных числа из 


2-го столбца, эту. сумму разделить на 4 (количество слагае- 
мых) и результат записать в 3-й столбец напротив третьего 
слагаемого. 


Скорректируем значения в строке «Среднее», чтоб б 
щая сумма была равна 0. Это необходимо чтобы в ты 
значения сезонной вариации в целом за год Ко и ы 

щий фактор вычисляется следующим образом: НЕ ны 
нок сезонных вариаций (-1) делится на ОЛ Кварталов В 
году (4). Поэтому из каждого числа этой строки надо вы- 
честь —1/4 = —0,25. Так как у нас округления до одной ци- 
фры после запятой, то из нечетных столбцов вычтем —0,3 

а из четных столбцов вычтем —0,2. В последней строке по. 


лучены значения сезонной вариации для соответствующе- 
го квартала года. 


Номер квартала в году 


2 Е + 4 
855 =1.5 
0 о | 


Среднее 


Скорректированная 
сезонная вариация 


Исключим сезонную вариацию из фактических данных. 


и Проведем десезонализацию данных. 
Че 
днее зЕ8 


Сезонная Десезонализированный 
ала. Номер вариация объем продаж 
ных Числа ть 5 А-5=Т+Е 

слагае 
гчество 
ВМ 
реты 
ро 


<> [со |-ч |©> |6 |+> |< |5 | 
= -- 
> > © |-з [00 [© |< | |< > 


|-- 
> 
= 


Из чисел 2-го столбца вычитаем числа 3-го столбца и 


Результат пишем в 4-м столбце. 


= а:+ 6х. 
равнение линии тренда Т а 
спользуя результаты главы 3, найдем коэффициенты 


Ь по данным первого и последнего и а 1Х (номе 
рендовое значение объема продаж = ^, ; р 
Вартала). 
Теперь займемся расчетом ошибок. 


Из чисел 3-го столбца вычи таем числа 4-го столбца и 
результат пишем в 5-м столбце. Среднее абсолютное откл. 
нение МАР = Уе;/п = 11,6/11 = 1,1; среднеквадратичес. 
кая ошибка М5Е = Уе*/п = 16,58/11 = 1,5. Мы ВИДИМ, что 
ошибки достаточно велики. Это скажется на качестве про- 
гноза. 


Объем Десезонализированный И" 
ибка 

Номер | продаж объем продаж Трендовое | ©! 

квартала значение 


4,1 


=: © < © |-а | <> |< [н> |2 [в> |4 


= | 


Дадим прогноз объема продаж на следующие два квар- 
тала. Мы считаем, что тенденция, выявленная по прошлым 
данным, сохранится и в ближайшем будущем. Подставля- 
ем номера кварталов в формулу и учитываем сезонную ва- 
риацию. 

Прогноз объема продаж в 12-м квартале: 

(1,9+1,1Х 12) + (-0,9) = 14,2 тыс. руб. 

Прогноз объема продаж в 13-м квартале: 

(1,9+1,1Х 13) +2 = 18,2 тыс. руб. 


Задача 47. В таблице указан объем продаж (тыс. руб.) 
за последние 11 кварталов. Дать на осн 
ных прогноз объема продаж на следующ 


овании этих дан- 
ие два квартала. 


ВВ Е ВЕ В С ИС ЕЛЕ 
ЕЕ Е С Е Е 


ующие Два КВ 
ная по прошли 
щем. Подстав: ‚ 
лем сезониую 


тренда. В таких случаях исполь 
модель. Для мульт 
чение А = трендовое зн 
ошибка Е. 


зуется мультипликативная 
иПлЛ ‘атт и 

ипликативной модели фактическое зна- 
ачение ТХ сезонная вариация 5ЖХ 


Пример 48. В таблице указа 
за последние 11 кварталов. Дад 
ных прогноз объема про 


н объем продаж (тыс. руб.) 
им на основании этих дан- 
даж на следующие два квартала. 


Числа 2-го столбца приведенной далее таблицы делим 


на числа 4-го столбца и результат (округляем до трех цифр 
после запятой) запишем в 5-й столбец. 


Номер Скользящая Центрированная Оценка 
аля средняя за скользящая сезонной 
р 4 квартала средняя вариации 


0,935 
1,401 
0,767 
0,880 
0,964 
1,415 
0,746 


= | > [сэ [во |на 
НЫ [© | [<> |<* 


Среднее 


Скорректированная 
сезонная вариация 


Значения сезонной вариации — это доли, число сезонов 
равно 4. Поэтому необходимо, чтобы сумма средних была 
равна 4. У нас же получилось 3,994. Следовательно, итого- 
вые коэффициенты сезонности нужно армии" | 
Житель 4/3,994. В последней строке указан | 
НЫе коэффициенты сезонности. 


Как показывают полученные оценки, в 1-м, 2-м и Зы 
кварталах года объем продаж снижается соответственно ва 

3%, 11,9% и 4,8% от соответствующих трендовых зна. 
я В 4-м квартале года объем продаж Увеличивается 
на 41% от соответствующего трендового значения. 

Исключим сезонную вариацию из фактических данных. 
Проведем десезонализацию данных. Числа 2-го столбца де. 
лим на числа 3-го столбца, результат округляем до одной 
цифры после запятой и пишем в 4-й столбец. 


Объем Коэффициент Десезонализированный 
Номер продаж сезонности объем продаж 


квартала А/5 =ТХЕ 
83,2 
84,0 
83,0 
85,1 
88,5 
89,7 
92,4 
92,2 
91,1 
93,1 
94,5 


Уравнение линии тренда Т =а + бх. 
Используя результаты главы 3, найдем коэффициенты 
аифв по данным первого и последнего столбцов. 
Трендовое значение объема продаж = 81,6 +1,2Х (номер 
квартала). 
Теперь займемся расчетом ошибок. 
Десезонализи- 


рованный объем Трендовое 
продаж значение 


А/5=ТХЕ 
82.8 | 


Среднее абсолютное отклонение МАР =» е//п=11,1/11=1, 
среднеквадратическая ошибка М5Е = Уе*/п=11,10/11=1,6. 
Мы видим, что ошибки малы и составляют порядка 1%. 
Это позволяет получить хорошие краткосрочные прогнозы. 

Дадим прогноз объема продаж на следующие два квар- 
тала. Мы считаем, что тенденция, выявленная по прошлым 
данным, сохранится и в ближайшем будущем. Подставля- 
ем номера кварталов в формулу и учитываем сезонную ва- 
риацию. 

Прогноз объема продаж в 12-м квартале: 

(81,6+1,2Х 12) Ж1,41 = 135,4 тыс. руб. 

Прогноз объема продаж в 13-м квартале: 

(81,6 +1,2Х 13) Ж0,757 = 73,6 тыс. руб. 


Задача 48. В таблице указан объем продаж (тыс. руб.) 
за последние 11 кварталов. Дать на основании этих дан- 
ных прогноз объема продаж на следующие два квартала. 


2 3 | 4 5 6 Е 9 
Объем продаж | 64 | 75 | 81 | 110] 66 | 77 91 | 120| 68 


Замечание. Ехсе! позволяет быстро вычислить оценки 
методом скользящей средней. Сервис -> Анализ данных —> 
Скользящее среднее —> ОК. Появляется диалоговое окно, 
которое нужно заполнить. В графе Интервал вводится ко- 
личество сезонов, для которых вычисляется скользящее 
среднее (по умолчанию это 3). Если требуется график, на 
котором будут указаны прогнозные и фактические значе- 
ния, то нужно поставить «галочку» рядом со словосочета- 
нием Вывод графика. ОК. Появляется итоговая таблица, 
которая содержит исходные данные и оценки, полученные 
методом скользящей средней. Если оценка находилась как 
среднее & слагаемых, то в таблице оценок она находится 
напротив последнего из этих № слагаемых. 


Глава 12 
НН сеет 


ЭКСПОНЕНЦИАЛЬНОЕ 
СГЛАЖИВАНИЕ 


При анализе временных рядов использовался метод сколь- 
зящей средней, где все данные (и поздние, и ранние) были 
равноправны. Более правильным представляется способ, в 
котором данным приписываются веса: более поздним дан- 
ным придается больший вес, чем более ранним. Этот ме- 
тод обеспечивает быстрое получение прогноза на один пе- 
риод вперед и автоматически корректирует любой прогноз 
в свете различий между фактическим и спрогнозирован- 
ным результатом. 


Прогноз 


$ 12.1. ПРОСТАЯ МОДЕЛЬ ЭКСПОНЕНЦИАЛЬНОГО 
СГЛАЖИВАНИЯ 


Новый прогноз = аХ (фактический результат в последний 
период) + (1 —а)Х (прогноз в последний период), то есть 
Ен = @А, + (1-— о) Е. Константу сглаживания ©. исследо- 


ватель выбирает из отрезка [0, 1]. В условиях стабильнос- 
ти часто ое [0,2; 0,4]. 


Пример 49. Вернемся к примеру 47. Пусть а = 0,8. 


Тогда 1 -а=1- 0,8 = 0,2. Предположим, что на первый 
и был дан прогноз 3. Дадим прогноз на 12-й квар- 


= 0,8 А, + 0,27, то есть числа в каж- 


я 8 = 5,6. Ит. д. 
КРУгляем до одной цифры после запятой. 


ся МЕТОД нод, 
и Ранние) был 
ляется стой в 
ее Поздним да: 
анним, 9101 №. 
038. На ОДИН 
т любой проги 
спрогновироме 


ыя | 1 
(фактически) (прогноз) 


3,8 


Прогноз объема продаж на 12-й квартал — 14,7 тыс. 
руб. 


Задача 49. В задаче 47 дать прогноз объема продаж 
на 12-й квартал методом простого экспоненциального сгла- 
живания. © = 0,8. Е} = 3. 


Замечание. Ехсе! позволяет быстро провести простое 
экспоненциальное сглаживание. Сервис -> Анализ данных 
> Экспоненциальное сглаживание -> ОК. Появляется диа- 
логовое окно, которое нужно заполнить. В графе Фактор 
затухания указать значение © (по умолчанию 0,3). ОК. 


$ 12.2. ЭКСПОНЕНЦИАЛЬНОЕ СГЛАЖИВАНИЕ 
С ПОПРАВКОЙ НА ТРЕНД 


Даем прогноз методом простого экспоненциального сгла- 
живания, а затем корректируем его с учетом тренда по сле- 
дующей формуле: ; 

прогноз с учетом тренда ЕТ; = прогноз Е, + тренд Т,. 

Тренд Т, = (1 —ВТ, 1 + (Е, — Ек-1), где Т, и Теа — сгла- 
женный тренд в. периоды Ё и #-1 соответственно, 6 — вы- 
бранная константа сглаживания. 

Начальное значение тренда может быть получено на ос- 
Ч0ве предположения. 

Пример 50. В примере 49 дадим прогноз объема про- 


даж на 12-й квартал методом экспоненциального сглажи- 
Зания с поправкой на тренд. Возьмем 6 = 0,4, Т\ = 0. 


Заполним таблицу. Из каждого числа 1-го столбца вы- 
читаем предыдущее число 1-го столбца и результат запи- 
шем во 2-й столбец. Каждое число 3-го столбца есть сумма 
числа, умноженного на 1-6=1-0,4 = 0,6, из предыдущей 
строки 3-го столбца и числа, умноженного на 6 = 0,4, из 
этой же строки 2-го столбца. Результат округляем до од- 
ной цифры после запятой. 

Прогноз’ объема продаж на 12-й квартал — 16,2 тыс. 
руб. 


Задача 50. В задаче 49 дать прогноз объема продаж 
на 12-й квартал методом экспоненциального сглаживания 
с поправкой на тренд. 6 = 0,4, т. =0: 


Глава 13 


СИСТЕМЫ ОДНОВРЕМЕННЫХ 
УРАВНЕНИИ 


Ряд экономических процессов моделируется несколькими 
уравнениями, содержащими как повторяющиеся, так и 
собственные переменные. Необходимо использовать систе- 
мы одновременных уравнений. 


Столбца вы. 


УЛЬТат запи. 
а ВОТЬ Су Пример 51. Модель «спрос-предложение» содержит 
предыдущей функции спроса, предложения и условие равновесия. 
р. 
8 0=04, в 90. О Вы 0 
тляем до 0% Ч - Во + Вр, + =», В > 0 
из 
9: — 4+. 
— 16,2 1% Здесь первое уравнение — функция спроса, второе урав- 
нение — функция предложения, третье уравнение — усло- 
З вие равновесия, р, — цена товара в момент времени 1, 
ема с ние, — случайные составляющие. 
лаживаи 


Пример 52. Кейнсианская модель формирования дохо- 
дов. Рассматривается закрытая экономика без государст- 
венных расходов. 


{“ = Во + ВлИ, + &ь 
о 

Здесь первое уравнение — Функция потребления, второе 
Уравнение — макроэкономическое тождество, у, и #, — зна- 
чения совокупного выпуска и инвестиции в момент време- 
НИ # соответственно, &, — случайная составляющая. 


13.1. СОСТАВЛЯЮЩИЕ СИСТЕМ 
ОДНОВРЕМЕННЫХ УРАВНЕНИЙ 


Переменные в системах одновременных уравнений бывают 
Двух видов: эндогенные (их значения определяются внутри 
дели) изэкзогенные (внешние по отношению к модели, 


Х значения считаются фиксированными). 
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Пример 53. В примере 52 с; и У а внутри 
модели (эндогенные переменные), #, задается вне модели 
(экзогенная переменная). Значения переменной &, исполь. 
зуются как заранее заданные. Из модели нельзя понять, 
как получаются значения переменной &,. 


исходную модель, называют. 

Уравнения, составляющие д з г. , т 

ся структурными уравнениями модели. К ним относятся 

поведенческие уравнения (описывают взаимодействие меж- 

ду переменными) и уравнения-тождества (должны выпол. 

няться во всех случаях, не содержат параметров и случай. 
ных составляющих). 

В приведенных уравнениях эндогенные переменные вы- 

ражены через экзогенные и предопределенные (лаговые эн. 


догенные переменные, значения которых определяются до 
рассмотрения соотношения). 


Пример 54. Рассмотрим кейнсианскую модель форми- 
рования доходов. 


{ с, = Во + Ву, +=, 
Ус Ц. 

Это структурные уравнения. Эндогенные переменные: 
с; и у,. Экзогенная переменная И 

Подставим значение переменной с, из первого уравне- 
ния во второе уравнение: у; = Во + Вау, + &,. Отсюда 
у: = Во/(1 —В,)+1/а — В:) +=/(1-—В,). 

Тогда с; = Во + Ву, + =, = Во + В; (Во/ (1 нЕ В.) Сл а = В,) 3% 
Е =,/(1 3% В,)) Е = Во/(1 г В!) а В/а а В.) я г/а ты В1). 


риведенные уравнения: 


У: = Во/& — В.) + иа-вВ;)+ =/ 1 В,), 
{ с, = Во/(1 — В,) + В &/(а —В;) + =/ В 
В левой части Уравнений — 
ные, в правой части — 
случайные отклонения. 


только эндогенные перемен- 
только экзогенная переменная и 


$ 13.2. КОСВЕННЫЙ МЕТОД НАИМЕНЬШИХ 
КВАДРАТОВ (кКмнк) 


Непосредственное использование МНК для о 
т ны из уравнений приводит к пл 
ты му применяют другие методы. 

й метод наименьших квадратов. 


ценки параме- 
охим результа- 
Например, кос- 
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Пос 
нения. , 
ки пара 
структу 


следу 


По структурным уравнениям строят приведенные Урав- 
нения. Для приведенных уравнений по МНК находят оцен- 


ки параметров и на их основании оценивают параметры 
структурных уравнений. 


Пример 55. Рассмотрим модель «сп 


рос-предложение» 
следующего вида: 


Е 
9; = 90 + ар, +=, 
9$ = Во+ Вр: + Выш, + 0, 
в 
т 
Здесь первое уравнение — функция спроса, второе уравне- 
ние — функция предложения, третье уравнение — условие 
равновесия, р, и ш, — цена товара и зарплата в момент вре- 
мени # соответственно, ё, и и, — случайные составляющие. 


Имеются следующие результаты наблюдений. 


Найдем оценки параметров этой системы уравнений с 


переменные помощью КМНК. 

Обозначим 45 = 4 через 4, Тогда 
вого урав | Ч 40 + ар, + &,, 
+5 (тео 9, = Во + Вр, + Вош, + о. 


Приравняем правые части этих уравнений: 
90 + ор, + =, = Во + Вр, + Выш, + о,. 
Отсюда: 
Р+= (Во — о) /(ои — Вл) + Ваш, (оц — В1) + (0, — =) (аа — В). 
Введем обозначения: 
ло = (Во 5)/ (а — В1), ли, = В>/(а1 — В1), 
ф, = (0, —= Д/о — В). 
Тогда р, = Ло тли, ть 
Подставим это выражение для р, в первое уравнение, 
Раскроем скобки и введем следующие обозначения: 
Лоо = 00 + алло, Ло: = “1711, $, р Оф, + Е,. 
Тогда а, = +ф 
Ч: = Лоо + ло, Т $. з 
Получаем систему из приведенных уравнений 
2 Лю + ли, + Фь 
Лоо + Ло, + Ф,. 


Оценим параметры каждого из этих уравнений при по- в) 
1 


мощи МНК (глава За г Е 
ты = 0,75, ло = 5,25, па = —0,46, ло = и =  МожиС 
Тогда оч = Ло1/ ла! = —0,46/0,15 = —0,61, в =лЛло— бл, = = 

= 11,53 — (-0,61)Х 5,25 = 14,73. Е 
Мы не можем оценить коэффициенты В; на основании 

полученных результатов. Возникает так называемая про- 


блема идентификации. 


Задача 51. Модель «спрос-предложение» содержит 


функции спроса, предложения 
{ 4, = бо + алр, + @2у: и, 

а, = Во+ В1Р, + 812. 

Здесь первое уравнение — функция спроса, второе урав- 
нение — функция предложения, 4,, Рь И У, — Количество 
товара, цена товара и доход потребителей в момент време- 
ни 1 соответственно, 1 и 80 ыы случайные составляющие. 


Эндогенные переменные: 4,, р,. Экзогенная переменная У,. 
Имеются следующие результаты наблюдений. 


Найти оценки параметров этой системы уравнений с по- 
мощью КМНК. 


$ 13.3. ПРОБЛЕМА ИДЕНТИФИКАЦИИ 


Проблема идентификации — это возможность численной 
Аир структурных уравнений по оценкам ко- 
риведенных уравнений. Можно ли найти 
пре о аае структурных уравнений по оцен- 
БАНИ ео А приведенных уравнений? Если да, ТО 

и денные оценки единственными? 

ь «очей система уравнений называется: 
ори если по оценкам коэффициентов 
В эвекий можно однозначно определить ко-. 

6) оидентири г а: . 
тов Нед ой 

можно получить нескольк& 


вариантов 
т значе Й 
ний; нии коэффициентов структурных урави 
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в) сверхиденти‹ у 
© $ Фицируемой (переопреде й 
оценкам коэффицие ределенной), если по 


нто 
можно определить коэс в приведенных уравнений невоз- 
ффициенты структурных уравнений 
Пример 56. Система Уравнений к 


идентифицируемая система яз примера 55 — сверх- 


Пример 57. Сист 
„ -истема уравн Я к 
тифицируемая система. равнений из задачи 51 — иден- 


8 13.4. НЕОБХОДИМЫЕ У 
СЛОВИЯ 
ИДЕНТИФИЦИРУЕМОСТИ 


В рн 

ети Пусть система одновременных уравнений включает в себя 
Време, № уравнений относительно М№ эндогенных переменных. Си- 
тЮЩИЬ, стема содержит М экзогенных либо предопределенных пе- 


НОЯ |, ременных. Пусть п и т — количество соответственно эндо- 
тенных и экзогенных переменных в проверяемом на иден- 
тифицируемость уравнении. 
Первое необходимое условие идентифицируемости. 
Уравнение идентифицируемо, если (М-п)+(М-т)> №-=1. 
Второе необходимое условие идентифицируемости. 
Уравнение идентифицируемо, если М-т>п-!1!. 


1. 
ий Пример 58. Рассмотрим модель денежного рынка 
{ г, = Во-+ Вли; + Ват, + в 


У, = 40+ “1 Г, фи, 
вка, ВВП и денежная 


И Здесь г» Ув т, — процентная ста х. 
} масса в году # соответственно, 8, И 0: — а 
после ляющие. Эндогенные переменные: Г; И У: (= 2) Экзоген- 
ый ная пе (М=\. 

ув ременная 1, 

— ги Первое уравнение содержит пе ЧОИАЕ 

и г. иу (п= 2) и экзогенную переменную 1 И. 

р и. и ет ли место №- п) +(М-т> М 1 

ий роверим, име 0> 1 (ложно). Первое необходимое 

С (2-2)+(-052 18. выполняется. Поэтому 
условие идентифицируемо ети и, 

и’ первое уравнение т эндогенные переменные г. и 
фи ей Второе уравнение сод т отенной переменной т, (т = 0)._ 
де! у: (п=2) и не содержит 9 (мп) + (М - т)>М-ы 

и Проверим, имеет ли м 1 (верно). Первое необходимое 

р (2—2)+(1-0) 22-1и бе выполняется. Поэтом 
И Условие идентифицирует ицируемо. 

я я? ’ Второе уравнение тоЧ#® идентиф 


Пример 59. Рассмотрим модифицированную модель 
Кейнса 


с, = Во+ В1у, +=, 
& = у, уу 9 
ЕСТЬ а. 

Здесь &, — объем государственных расходов. Эндоген- 
ные переменные: с,, & иу, (М = 3). Экзогенные перемен- 
ные: &, иу, | (М = 2). 

а. эндогенные переменные с, и у, (п = 2) 
и не содержит экзогенных переменных (т = 0). 

(№М-п)+(М-т) > М-1, то есть (3-—2)+(2-0) > 3-1и 
3 > 2. Поэтому первое уравнение переопределено. 

Второе уравнение содержит эндогенные переменные ци 
У, (п = 2) и экзогенную переменную у,_| (т = 1). 

(№М-п)+(М-т)>М-1, то есть (3—2)+(2-1) >3-1и 
2 =2 (верно). Поэтому второе уравнение точно идентифи- 
цируемо. 

Третье уравнение содержит эндогенные переменные с,, 
1 и у, (п = 3) и экзогенную переменную 8, (т=\. 

(№М-—п)+(М-т) > М-1, то есть (3—3)+(2-—1) >3-1и 
1>2 (ложно). Поэтому третье уравнение неидентифициру- 
емо. 


Задача 52. Рассматривается модифицированная мо- 
дель «доход-потребление» 


о. ыы Во ся Ву, ще Вас, 1 Е, 
й = %0 Чу", = о, 
т СЫ НЕ,. 

Указать эндогенные и экзоген: 


лить идентифицируемость ст 
вить приведенную систему. 


ные переменные, опреде- 
руктурных уравнений, соста- 


$ 13.5. ДВУХШАГОВЫЙ МНК (дмнк) 
Этот метод применяется к пе 
Пример 60. Вернемся к 


Первое Уравнение 
переопр 


реопределенным уравнениям. 
примеру 59. | 


исходной сист - Е: 
®делено, то есть по истемы с; = Во + Вуз В 


Уравнений ициентов прив 
строим приведенн 
Т №, (ш, — случа 


Ч, 


\ Эадоь, 
> Пере, 


Ау (=) 


0>3-11 
Но, 
ЭМенные |1 
1). 
-1)>3-11 
о идентии" 


ременвые 
ы 
ры 


дентифими" 


С: 
овай8* № 


отклонение), находим с помощью МНК оценки коэффици- 
ентов Л10, 11; Л12 И из уравнения получаем оценку й, по 
экзогенным переменным у,_| и &,. 

Из уравнения с, = Ву + В1й, находим оценки коэффици- 
ентов Во и В1 с помощью МНК. 


Задача 53. Применить ДМНК в задаче 52. 


Ответы 


1. (77,78; 80,22). 

2. 239. 

3. (77,5; 80,5). 

4. 240. 

5. (0,09; 0,15). 

6. 77860. 

7. Автомат нужно отрегулировать. 

8. Станок настроен правильно. 

9- Выборка не противоречит утверждению производите- 
ля. 


10. Выборка не противоречит утверждению производи- 
теля. 


11. Риски инвестиций равны. 


12. Автоматы фасуют чай в пачки разного среднего ве- 
са. 

13. По первой технологии требуется в среднем больше 
времени для производства одной детали. 

14. По первой технологии 
времени для производства одн 

15. Побочные эффекты от 
возникают чаще, 

16. Износоуст 


требуется в среднем больше 
ой детали. 


нового лекарства у женщин 
чем у мужчин. 


[-1.95[4.92 0,55] 
. 71,79 


7 тыс. руб. 
Е и переменными *, У есть линейная связь. 
а & 
23. (о в аными х, ИУ есть линейная связь. 
. (67 


: ол: 147 
84; 1 

й, 0,932. Ко 
я О 

М Не ухудити 

ь 3 , жно стра 

Гетероскеди 

и Гетероскеда 


= , 


: Автокоррел 
: Гипотеза о 


28. (72,84; 147,08), (0,16; 1,62), (15,54; —6,74). 
29. Все коэффициенты статистически значимы. 
30. 0,932. Коэффициент детерминации статистически 
_ значим. 
31. Не ухудшилось. 
32. Нужно строить единое уравнение регрессии. 
33. Гетероскедастичность отсутствует. 
34. Гетероскедастичность отсутствует. 
ЗБ. у = 0,40 + 0,01х. 
36. Автокорреляция отсутствует. 
37. Гипотеза об отсутствии автокорреляции не может 
быть ни принята, ни отклонена. 
38. у = 3,77 — 1,72х. 
39. 0,772. 
40. у = 347,25 — 3,05М - 59,40Е + 26,228. 
41. у= —53,19 + 1,58х + 14,842. 
42. г = Во -+ Вах, = = ШУ. 
43. у = Во + В12, 2 = 1х. 
44. у = Во + В12, 2 = ш1/х. 
45. 2 = А+ Вх, 2 = Шу, В = 2^. 
46. Между результатами исследований есть связь. 
47. 14,3 тыс. руб., 17,7 тыс. руб. 
48. 123 тыс. руб., 71,6 тыс. руб. 
49. 15,3 тыс. руб. 


ю производите 


нию производ: 


ого средне ** 


среднем бое 50. 17,2 тыс. руб. 
бе 51. 4; = -8,20 + 4,80р:. Функция спроса не идентифи- 
средне" Хо цируема. 
я 52. Эндогенные переменные: сь, &, У:. Экзогенные пере- 
злу менные: с, 1, Г,, &,. Третье уравнение идентифицируемо, 
прет остальные — переопределены. 


| се = пло + лиг, + 128: + ПЗС НШь 
^ в = 0+1" +9 
| ре ро + долг, + П228, + Лозсь1 +81. 
| где пло = (Во + Вл10)/(1 — Вл), лаз = Вата/ С — Вл), 
г пи = В./(1 — Вл), лаз = Ва/ — Вл = лов, 
я | о; = (Вло, + =)/ А — Ву), 


20 = ло + 10, Лол = Ли + 1, 722 = Л12 + 1, 


УД 
т 53 = ш, и. 
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